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摘 要 中文 词 切 分 的 认 知 机 制 一 直 是 心理 语言 学 关注 的 焦点 问题 之 一 ， 研 究 发 现 中 文 读者 可 使 用 词素 
位 置 概率 等 语言 学 线索 帮助 词 切 分 ， 而 首 、 尾 词素 位 置 概率 的 重要 程度 以 往 研 究 观点 并 不 一 致 。 本 研究 
通过 词汇 判断 和 眼 动 实验 ， 考 察 中 文 读者 对 首 、 尾 词素 位 置 概率 的 利用 情况 。 实 验 la 和 lb 采用 词汇 判 
WES, 考察 在 不 同 词 频 条 件 下 词 首 与 词尾 词素 位 置 概率 对 词汇 识别 的 影响 。 在 错误 率 和 反应 时 指标 上 ， 
高 频 词 条 件 下 词 首 与 词尾 词素 位 置 概率 效应 不 显著 ; 低频 词 条 件 下 词 首 词素 位 置 概率 效应 显著 ， 词 尾 词 
素 位 置 概率 效应 不 显著 。 实 验 2a 和 2b 采用 句子 阅读 任务 ， 考 察 在 自然 阅读 情境 中 被 试 对 词素 位 置 概率 
的 运用 。 在 凝视 时 间 、 回 视 路 径 时 间 和 总 注视 时 间 指 标 上 ， 低 频 词 条 件 下 词 首 词素 位 置 概率 效应 显著 ， 
词尾 词素 位 置 概率 效应 不 显著 。 高 频 词 条 件 下 词 首 与 词尾 词素 位 置 概率 效应 均 不 显著 。 词 汇 判断 和 眼 动 
证 据 共同 表明 ， 词 素 位 置 概率 信息 是 中 文 读 者 重要 的 语言 词 切 分 线索 ， 且 与 词尾 词素 位 置 概率 相 比 ， 词 
首 词 素 位 置 概率 在 词汇 切 分 与 识别 过 程 中 发 挥 的 作用 更 大 。 同 时 ， 词 素 位 置 概率 线索 的 运用 会 受到 词 频 
的 影响 ， 研 究 结果 支持 复合 词 加 工 的 混合 通达 表征 模型 。 
关键 词 ” 词 切 分 ， 词 素 位 置 概率 ， 中 文 阅读 ， 眼 动 
分 类 号 B842 


1 引 

阅读 过 程 中 读者 对 词素 位 置信 息 的 加 工 是 词汇 识别 不 可 或 缺 的 步 又， 一 般 而 言 ， 词 汇 识 别 包含 两 类 
编码 ， 即 身份 信息 编码 和 位 置信 息 编码 。 身 份 信息 编码 是 指 哪些 字符 构成 了 词汇 ， 而 位 置信 息 编码 是 指 
字符 在 词汇 中 的 相对 顺序 ( 滑 慧 敏 等 , 2017)。 字 符 的 位 置信 息 在 词汇 识别 中 有 重要 作用 ， 英 文中 读者 区 
分 相同 字母 组 成 的 单词 时 便 依据 字母 的 位 置 差异 ， 如 causal 和 casual。 同 样 ， 中 文 读者 也 由 词素 位 置信 
息 识 别 变 位 词 ， 璧 如 “上 海 ” 和 “海上 ”二 者 身份 信息 相同 ， 通 过 词素 位 置 区 分 语义 。 若 词素 位 置 判 断 


能 力 不 足 则 会 干扰 正常 阅读 ， 一 部 分 阅读 障碍 儿童 对 汉字 位 置 出 现 判断 困难 ， 测 试 成 绩 显 著 低 于 控制 组 
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儿童 ( 田 晓 梅 等 , 2006)。 词 素 位 置信 息 的 加 工 是 通 往 词 汇 识别 和 更 高 语言 水 平 加 工 的 重要 途径 ， 离 不 开 


视觉 和 认 知 加 工 系 统 的 相互 作 月 


Ho Halk, f 


究 者 对 拼音 文字 的 字母 位 置信 息 进行 了 深入 探究 ， 发 现 了 字 


母 的 换 位 效应 (transposition-letter effect, TL effect)， 即 人 们 在 阅读 一 个 内 有 字母 换 位 的 非 词 时 ， 倾 向 于 将 
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词尾 的 换 位 会 对 词 


究 更 进一步 ， 探 究 了 词 首 与 词 


处 于 不 同 的 位 置 对 词汇 识别 所 起 的 作用 不 同 。 对 词素 位 置 与 整 词 词 ; 
们 认识 汉字 水 平 自 下 而 上 的 加 工 对 词 切 分 及 阅读 认 知 机 制 的 理解 。 


[识别 起 到 更 大 的 破坏 作 
发 现 词 首 的 字母 或 者 词 首 的 字 更 重要 。 综 上 所 述 ， 词 素 位 置信 息 的 加 工 是 词 ; 


尾 位 置 之 于 词汇 识 另 


VAIS 


响 汉 字 位 置 的 加 工 ( 顾 俊 娟 SE, 2020). HI SE A (1999) Ae El ie] eA REI F 1 


迁 等 人 (2010) 应 用 眼 动 技术 探究 词素 换 位 对 词素 识别 的 影响 ， 发 现 含 高 频 词素 换 位 的 词 
-位 置 编码 ， 字 形 编码 发 生 在 阅读 的 早期 阶段 
动 范式 ,比较 了 不 同 启 


频 词素 换 位 的 词汇 。 


而 位 置信 息 的 编码 则 具有 一 定 灵活 性 (Gu et al., 2015)。 徐 还 嘉和 隋 雪 (2018) 应 用 启 


ERT, 


让 识别 为 与 之 对 应 的 真 词 , 并 且 这 种 倾向 比 将 内 有 蔡 换 字母 的 非 词 当 作 真 词 的 概率 要 高 (Perea & Carreiras, 
EE 要 程度 ,研究 认 为 比 起 词 内 部 的 换 
](Yakup et al., 2014). Schotter 等 人 (2012) 
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His] x 


[识别 关系 的 深入 思考 ， 将 有 助 于 我 


中 文 阅 读 同 样 重视 词素 位 置 的 作用 ， 也 发 现 了 字母 转 置 效 应 (Gu et ab, 2015)， 且 发 现 词 边界 信息 影 


需 指 出 的 是 ， 中 文 的 字 序 编码 区 别 了 


动 时 间 下 首 字 蔡 换 词 与 尾 字 蔡 换 词 的 


E 常 语义 启动 的 效果 , F 
[识别 要 快 于 低 


蔡 换 对 词汇 识别 的 破坏 性 更 大 ， 训 


E 实 了 词 首 在 词汇 加 


词汇 加 工 的 重要 环节 ， 且 值得 思考 的 是 ， 
又 是 怎样 作用 于 词汇 识别 的 呢 ? 具体 而 言 ， 词 素 位 置 概率 指 的 是 汉字 出 现在 词 首 或 词尾 时 双 字 词 的 次 数 


占 该 汉字 组 成 的 所 有 双 字 词 ( 无 论 出 现在 首 


词素 的 特定 位 置 ( 如 词 首 ) 


启动 条 件 ， 发 现 首 字 替 换 词 对 目标 词 的 启动 效果 最 小 ， 说 明 首 字 的 
中 的 重要 性 。 总 体 来 看 ， 词 素 位 置信 息 的 加 工 是 
能 影响 词汇 加 工 ， 那 么 词素 位 置 概率 


字 还 是 尾 字 ) 的 比重 (Yen et al., 2012)。 例 如 ， 在 语料库 中 “ 消 ” 


可 组 成 39 个 双 字 词 ， 其 出 现在 词 首 可 组 成 33 个 词 ， 如 “消炎 ”“ 消 息 ””“ 消 失 ” 等 ， 为 此 ， 其 词 首 词 


素 位 置 概率 为 0.85。 可 见 ， 


(2021) 发 现 被 试 在 低 词素 位 置 概率 条 件 下 的 凝视 时 
效应 。 而 且 读 者 对 词素 位 置 概率 的 利 月 


66 MM o» AL 
消 ” 常 


的 能 力 强 于 小 学 生 (Liang et al., 2015)。 


词素 位 置 概 率 现象 是 


小 的 语言 单位 ， 而 词素 是 指 具 有 独立 形 


P 文 词汇 的 显 


表现 出 发 展 上 的 差异 怡 


居于 双 字 词 词 首 ， 这 为 读者 提供 了 较 清 晰 的 词 边界 信息 。 连 坤 予 等 人 


E， 即 大 学 生 运 月 


间 显 著 长 于 高 概率 条 件 ， 表 现 出 明显 的 词素 位 置 概率 


词素 位 置 概率 帮助 词 切 分 
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h 文 以 汉字 为 


词 的 固定 位 置 ， 其 ! 


8.2% 


惯 第 居于 词 首 ，7.5% 惯 常 居于 词尾 ，2.1% 以 单字 词 形 式 呈 现 ( 白 


E 
aS 


BSc, Mi EAA A ae 


和 意义 的 最 小 语言 单位 ( 张 玲 燕 SR, 2013), FIN, MBBS A 


统 中 大 多 数 词 是 双 字 词 ， 词 素 位 置信 息 相 对 明确 ( 赵 思 敏 等 , 2017)。 据 统计 ， 约 20% 的 汉字 出 现在 多 字 


学 军 , HEF, 


2017)， 词 素 位 置 的 这 一 特性 为 中 文 读 者 提供 了 词 与 词 之 间 隐 含 的 边界 ， 为 中 文 词汇 的 切 分 提供 了 可 用 线 
索 。 因 为 中 文 词汇 的 识别 与 切 分 区 别 于 拼音 文字 ， 拼 音 文字 中 的 空格 为 读者 提供 了 明确 的 单词 首尾 部 分 


的 物理 空间 边界 信息 ， 
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帮助 计划 下 一 次 眼 跳 ， 促 进 单词 的 识别 (Perea & Acha, 2009; Rayner, 1998). MH 


文 无 词 间 空 格 标示 词 边界 ， 邻 近 的 汉字 可 组 成 双 字 词 、 三 字 词 及 四 字 词 ， 并 且 中 文 组 词 的 模糊 性 也 加 大 
了 词 切 分 难度 (Gao et al., 2006)， 但 中 文 读者 并 未 遭遇 特殊 阅读 困难 ， 其 阅读 速度 可 与 拼音 文字 读者 保持 
一 致 Liversedge et al., 2016)， 那 么 中 文 读者 如 何 进行 词 切 分 就 成 为 汉语 阅读 的 一 个 独特 问题 ， 其 必定 1 
助 某 些 隐 含 线索 协助 词 切 分 。 此 时 ， 词 素 位 置 概率 信息 可 作为 一 种 隐 含 的 语言 线索 帮助 词 切 分 ， 由 于 词 
素 经 常 出 现在 双 字 词 的 某 一 特定 位 置 ( 词 首 或 词尾 )， 一 定 程 度 上 标示 出 了 词 与 词 之 间 的 隐藏 边界 ， 据 此 ， 
研究 者 们 开展 了 一 系列 研究 。 梁 菲菲 (2013) 用 新 词 习 得 的 方式 探讨 了 中 文 读者 对 词素 位 置 概率 线索 的 使 
用 ， 研 究 操纵 首 、 尾 词素 的 位 置 概率 ， 创 设 三 种 类 型 的 假 词 作为 新 词 ， 发 现在 词素 位 置 概率 一 致 条 件 下 
的 注视 时 间 和 注视 次 数 显著 低 于 不 一 致 条 件 。Yen 等 人 (2012) 采 用 边界 范式 的 研究 表明 , 中文 读者 能 够 利 
用 词尾 词素 位 置 概率 指导 词汇 识别 和 眼 跳 控 制 。 高 淇 (2018) 以 儿童 和 成 人 为 研究 对 象 ， 对 词 首 、 尾 词素 
位 置 概率 的 关系 进行 了 推论 ， 即 词 首 词素 位 置 概率 的 高 低 对 儿童 和 成 人 的 阅读 行为 没有 影响 ， 但 词尾 词 
素 位 置 概 紊 显著 影响 了 儿童 和 成 人 的 阅读 表现 ,研究 结果 进一步 肯定 了 词尾 词素 位 置 概率 的 词 切 分 作用 。 
然而 一 项 后 续 研 究 提供 了 不 同 的 实验 证 据 ， 即 儿童 和 成 人 均 能 利用 词 首 和 词尾 词素 位 置 概率 指导 阅读 活 
动 ( 连 坤 予 等 , 2021)。 可 见 ， 词 首 与 词尾 词素 位 置 概率 在 阅读 过 程 中 的 作用 还 未 取得 较为 统一 的 观点 ， 
是 词尾 词素 位 置 概率 发 挥 了 主要 作用 ， 还 是 词 首 与 词尾 同等 重要 ? 这 一 问题 的 解决 有 竺 开展 后 续 研 究 深 
入 考察 与 澄清 。 

值得 一 提 的 是 ， 有 研究 指出 低频 词 倾向 于 词素 通达 ， 而 高 频 词 可 能 经 由 整 词 路 径 通达 (高 淇 , 2018). 
换言之 ， 在 心理 词典 中 低频 词 倾向 于 以 单个 字 的 形式 进行 表征 ， 而 高 频 词 常 以 整体 形式 表征 ( 白 学 军 等 ， 
2015)。 事 实 上 ， 中 文 复合 词 的 表征 方式 一 直 存 有 争议 ， 在 识别 复合 词 时 ， 是 通过 整 词 表征 亦 或 经 由 分 解 
的 词素 表征 ， 以 及 二 者 发 挥 作用 的 程度 如 何 ， 一 直 是 心理 语言 学 研究 的 热点 问题 。 研 究 者 基于 不 同 的 研 
究 材 料 、 范 式 及 技术 手段 给 予 了 不 同 程度 的 回答 ， 既 往 研究 证 据 提示 词 频 会 影响 词汇 加 工 ， 高 频 词 的 注 
视 时 间 显 著 低 于 低频 词 (Wei et al., 2013)， 从 高 频 中 央 四 词 到 副 中 央 四 词 的 眼 跳 长 度 显 著 长 于 从 低频 词 跳 
出 的 眼 跳 长 度 ( 王 永 胜 等 , 2018), 对 不 同 词 频 的 使 用 会 影响 真 词 与 换 位 假 词 的 判断 (Vergara-Martinez et al., 
2013)。 相 关 研 究 指 出 词素 特征 是 词汇 识别 的 重要 影响 因素 ， 并 且 在 低频 词 加 工 中 表现 的 更 加 明显 ( 彭 聘 
龄 等 , 1999)。 与 词素 位 置 颠倒 的 高 频 词 相 比 ， 读 者 对 词素 位 置 颠倒 的 低频 词 识别 较 慢 ( 卞 迁 等 , 2010)。 
可 见 ， 整 词 的 词 频 对 词汇 的 加 工具 有 潜在 影响 。 

研究 者 还 关注 到 ， 在 中 文 的 词汇 识别 过 程 中 ， 首 词素 与 尾 词素 对 整 词 识别 的 贡献 不 同 ， 且 词 频 的 变 
化 会 带 来 阅读 行为 的 改变 ， 这 使 得 词 频 对 词素 位 置 概率 线索 的 作用 成 为 一 个 新 问题 。 不 同 词 频 条 件 下 词 
素 位 置 概率 还 能 和 否 发 挥 作 用 ， 词 首 与 词尾 词素 位 置 概率 的 作用 差异 如 何 ? 探查 既往 研究 发 现 其 未 对 词 频 
做 出 具体 区 分 ， 这 是 否 成 为 词 首 与 词尾 词素 位 置 概率 作用 不 同 的 潜在 影响 因素 ? 另外 ， 根 据 经 典 的 词汇 
识别 模型 ， 如 McClelland 和 Rumelhart(1981) 的 交互 激活 模型 、Davis(2001) 的 自我 组 织 词汇 习 得 与 识别 模 


AL. Taft 等 人 (2005) 的 多 层 激 活 模型 ， 词 频 是 进入 词汇 通达 的 重要 因素 ， 其 可 能 会 影响 到 汉语 词素 位 置 
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WRT CATAL LE AS FR] ESR. Li 和 Pollatsek(2020) 提 出 的 中 文 阅 读 的 整合 模型 也 指出 词 频 
是 影响 词汇 识别 的 重要 因素 ， 词 频 直 接 影 响 词汇 节点 的 输入 ， 并 成 功 预测 了 词 频 对 眼 跳 长 度 的 影响 。 鉴 
于 此 ， 有 必要 在 探究 首 、 尾 词素 位 置 概率 认 知 机 制 的 基础 上 ， 进 一 步 明确 整 词 词 频 的 内 在 影响 ， 探 究 中 
文 复合 词 的 加 工 方式 ， 即 复合 词 的 表征 究竟 是 基于 词素 、 整 词 ， 亦 或 是 混合 通达 ? 据 此 ， 对 上 述 问 题 的 
考察 便 体现 出 一 定 的 新 意 和 价值 。 第 一 ， 对 复合 词 认 知 加 工 的 组 件 词素 作用 的 研究 ， 可 加 深 对 复合 词 通 
达 表 征 网 络 的 理解 。 第 二 ， 当 前 汉语 词素 位 置信 息 加 工 机 制 的 研究 尚 浅 ， 持 续 探讨 词素 位 置 概率 之 于 词 
切 分 的 作用 ， 有 助 于 回答 中 文 读者 如 何 确定 词 边界 的 问题 ， 为 仍 处 于 探索 中 的 汉字 位 置 编码 机 制 提供 新 
视角 。 

研究 设计 了 4 个 实验 ， 实 验 la 和 lb 采用 词汇 判断 任务 ， 创 设 不 同 的 首 、 尾 词素 位 置 概率 条 件 ， 同 
时 操纵 目标 词 词 频 。 另 外 ， 由 于 汉语 中 高 、 低 频 词 汇 难以 平衡 词 首 和 词尾 的 词素 位 置 概率 ， 故 未 采用 2 
词 频 (高 、 低 )X2( 词 首 词素 位 置 概率 : 高 、 低 )X2( 词 尾 词素 位 置 概率 : 高 、 低 ) 的 实验 设计 , 而 是 采用 2( 词 
首 词素 位 置 概率 : 高 、 低 )X2( 词 尾 词素 位 置 概率 : 高 、 低 ) 的 两 因素 被 试 内 重复 测量 实验 设计 ， 分 开 考察 
词 频 因素 的 影响 便于 更 清晰 地 考察 不 同 词 频 条 件 下 词素 位 置 概率 的 重要 程度 。 词 素 位 置信 息 的 加 工 是 词 
汇 加 工 的 重要 阶段 ， 词 首 与 词尾 在 词汇 识别 过 程 中 发 挥 着 不 同 作 用 ， 词 首 作 用 较为 积极 ， 研 究 假设 : 词 
素 位 置 概率 信息 是 中 文 词汇 识别 的 语言 线索 ， 且 与 词尾 词素 位 置 概率 相 比 ， 词 首 词素 位 置 概率 在 词汇 识 
别 中 的 促进 作用 更 大 。 实 验 2a 和 2b 采用 句子 阅读 任务 ， 记 录 被 试 在 句子 阅读 过 程 中 的 眼 动 特征 ， 进 一 
步 考 察 处 于 生态 效 度 更 高 的 自然 阅读 情景 下 词素 位 置 概率 效应 是 否 存在 ， 以 及 作用 发 挥 在 加 工 的 哪 一 阶 
段 。 研 究 假设 : 读者 能 利用 词素 位 置 概率 线索 帮助 词 切 分 ， 词 首 词素 位 置 概率 的 优势 更 为 明显 ， 同 时 词 
频 会 影响 这 一 作用 的 发 挥 ， 即 低频 词 条 件 下 读者 能 够 运用 词素 位 置 概率 线索 助力 词 切 分 ， 高 频 词 条 件 下 
这 种 促进 作用 会 减弱 。 依 据 Li 等 人 (2009) 提 出 的 词 切 分 与 词汇 识别 模型 ， 中 文 词汇 识别 是 一 个 交互 激活 
的 过 程 ， 字 水 平 的 激活 前 馈 到 词 水 平 ， 反 过 来 词 单元 的 激活 也 反馈 到 组 成 该 词 的 字 水 平 。 字 词 层 面 的 信 
交互 激活 并 相互 影响 ， 属 于 该 词 的 字 比 其 它 字 激活 更 快 ， 同 时 属于 该 字 的 位 置 比 其 它 字 的 位 置 激活 更 
快 。 如 果 在 高 频 词 中 未 发 现 词 素 位 置 概率 效应 ， 说 明 词 汇 识别 是 经 由 整 词 表征 的 ， 输 入 刺激 直接 激活 了 
心理 词典 的 整 词 词 条 。 如 果 在 低频 词 中 观察 到 词素 位 置 概率 效应 ， 则 表明 词汇 识别 过 程 中 发 生 了 分 解 的 
词素 表征 ， 词 素 激活 后 影响 到 整 词 识别 。 鉴 于 此 ， 复 合 词 的 加 工 既 存在 整 词 表征 又 存在 词素 表征 ， 研 究 
结果 倾向 于 支持 复合 词 加 工 的 混合 通达 表征 观点 。 


2 实验 la: 词素 位 置 概率 在 噩 频 词 词汇 识别 中 的 作用 

2.1 实验 目的 
采用 词汇 判断 任务 ， 操 纵 词 首 和 词尾 词素 位 置 概率 ， 以 高 频 目标 词 为 研究 对 象 ， 探 讨 词素 位 置 概率 
否 影响 被 试 的 词汇 识别 。 


2.2 实验 方法 
2.2.1 被 试 

60 名 天 津 师范 大 学 在 校 学 生 , 其 中 女生 40 名 , 男生 20 44, 年 龄 在 18~22 岁 之 间 (M=19.70, SD=1.94)。 
被 试 均 为 汉语 母语 者 ， 视 力 或 矫正 视力 正常 ， 均 不 知 实验 目的 ， 实 验 结束 可 获得 一 定 报酬 。 为 保证 较 高 
的 统计 效能 (Faul et al., 2007), 在 实验 实施 前 采用 G*power 分 析 方 法 对 样本 量 进行 估算 。 根 据 中 等 效应 量 
水 平 (f=0.25) 及 0.01 的 oa 水平 ，G*power 分 析 结 果 建 议 实验 需要 48 名 被 试 可 使 统计 效能 达到 0.95。 考 虑 
到 可 能 有 无 效 被 试 ， 实 际 取样 60 名 。 
2.2.2 实验 设计 

采用 2( 词 首 词素 位 置 概率 ， 高 、 低 )X2( 词 尾 词素 位 置 概率 : 高 、 低 ) 的 两 因素 被 试 内 重复 测量 设计 。 
2. 2.3 实验 材料 

参照 中 国电 视 电 影 和 旁白 的 汉语 词汇 和 笔画 频率 语料库 (Cai & Brysbaert, 2010)， 为 保证 词素 位 置 概 率 
条 件 的 区 分 度 , 将 词素 位 置 概率 高 于 0.7 定义 为 高 概率 , 低 于 0.3 定义 为 低 概率 。 词素 位 置 概 率 计算 方法 : 
字 出 现在 词 首 或 词尾 时 双 字 词 的 数量 除 以 汉字 所 能 组 成 的 所 有 双 字 词 (无 论 出 现在 首 字 还 是 尾 字 ) 的 数 
量 。 操 纵 词素 位 置 概率 的 高 低 ， 共 选取 80 个 双 字 词 ， 将 其 分 为 四 种 条 件 (每 种 条 件 下 20 个 双 字 词 ): (1) 
高 词 首 词 素 位 置 概率 、 高 词尾 词素 位 置 概率 ; (2) 高 词 首 词素 位 置 概率 、 低 词尾 词素 位 置 概 率 ; (3) 低 词 首 
词素 位 置 概率 、 高 词尾 词素 位 置 概率 ; (4) 低 词 首 词素 位 置 概率 、 低 词尾 词素 位 置 概率 。 控 制 四 种 条 件 下 


双 字 词 的 词 频 差异 不 显著 (F(3, 124)=0.15, p=0.92)、 词 首 笔画 数 差 异 不 显著 (F(3，124)=2.19，p=0.09)、 词 


Mi 


xi 


尾 笔画 数 差 异 不 显著 (F(3，124)=1.24, p=0.21)、 词 首 字 频 (F(3，124)=0.98,，p=0.40) 和 词尾 字 频 (F(3， 
124)=0.42, p=0.73) 的 差异 不 显著 。 考 虑 到 词素 结构 可 能 对 词汇 认 知 加 工 造 成 影响 ， 材 料 选取 时 尽 可 能 避 
免 选取 偏 正 复合 词 和 含有 词缀 的 双 字 词 。 同 时 ， 对 双 字 词 词 首 和 词尾 的 构 词 能 力 进行 了 控制 ， 构 词 能 力 
是 指 词素 所 能 构成 双 字 词 的 数量 ( 汉 丽 萍 , 宋 志明 , 2004)， 例 如 ， 在 语料库 中 “ 透 ” 字 可 以 组 成 “透明 ”、 
“透彻 ”、“ 看 透 ” 等 20 个 词 ， 那 么 其 构 词 能 力 即 为 20。 四 种 条 件 词 首 和 词尾 的 构 词 能 力 之 间 差 异 不 
SLE. ts<1, ps>0.05. Mab, i 15 名 不 参加 实验 的 同学 对 目标 词 的 熟悉 度 和 语义 透明 度 进行 评定 ， 其 
中 1 代表 “非常 不 熟悉 ”，5 代表 “非常 熟悉 ”，1-~5 的 变化 代表 词语 熟悉 性 的 增强 ， 目 标 词 的 熟悉 度 
为 M=4.18(SD=0.17); 语义 透明 度 指 的 是 复合 词 的 语义 能 从 其 各 个 组 成 词素 的 语义 推 知 的 程度 。 其 中 1 
代表 “完全 不 透明 词 ”，5 代表 “完全 透明 词 ”，1~5 的 变化 代表 语义 透明 度 的 增强 ， 目 标 词 的 语义 透 
明度 为 M=4.24(SD=0.15)。 实 验 材料 的 基本 参数 情况 见 表 1。 


表 1 实验 材料 


词素 位 置 目标 词 ” 词 首 词素 词尾 词素 整 词 词 首 词尾 词 首 词尾 
概率 类 型 举例 位 置 概率 位 置 概率 词 频 笔画 数 笔画 数 字 频 字 频 
高 词 首 - 高 词尾 m 0.81 (0.10) 0.78 (0.09) 50.39 (19.62) 9.30(2.05) 8.25 (3.62) 271.99 (230.75) 287.99 (263.62) 
高 词 首 - 低 词 尾 。 预约 0.80 (0.10) 0.29 (0.15) 54.15 (58.73) 9.35 (2.01) 8.65 (3.00) 220.14 (165.11) 239.37 (158.56) 
氏 词 首 - 高 词尾 。 利益 0.25 (0.05) 0.78 (0.10) 52.81 (42.72) 9.70 (2.60) 7.85 (2.54) 332.77 (188.32) 320.28 (239.62) 
氏 词 首 - 低 词尾 。 派对 ^ 0.27 (0.06) 0.29 (0.17) 46.02 (29.63) 7.85 (3.08) 7.35 (2.30)  279.91(248.53) 296.99 (258.88) 
注 : 高 词 首 -高 词尾 = 高 词 首 词素 位 置 概率 、 高 词尾 词素 位 置 概率 ; 高 词 首 - 低 词尾 = 高 词 首 词素 位 置 概率 、 低 词尾 词素 


位 置 概率 ; 低 词 首 -高 词尾 = 低 词 首 词素 位 置 概率 、 高 词尾 词素 位 置 概率 ; 低 词 首 - 低 词尾 = 低 词 首 词素 位 置 概率 、 低 词尾 词 


素 位 置 概率 ， 以 下 同 。 词 频 和 字 频 的 单位 为 次 / 百 万 ， 括 号 内 为 标准 差 ， 以 下 同 。 
为 平衡 词汇 判断 的 对 错 项 目 数 ， 在 材料 中 加 入 填充 词 构 成 “ 否 ” 反 应 ,填充 词 是 由 真 字 构 成 的 假 词 ， 


其 中 假 词 中 字 的 笔画 与 真 词 中 字 的 笔画 差异 不 显著 ，!<1，p>0.05;， 假 词 中 的 字 频 与 真 词 中 的 字 频 差异 


202208.00022v1 


不 显著 , t<1, p>0.05. 
2. 2.4 实验 仪器 

实验 采用 联想 ThinkPad T-14 笔记 本 电脑 ， 屏 幕 为 14 Xp, 分辨 率 为 1024X728 像素 ， 刺 激 为 32 
号 宋体 ， 每 个 汉字 大 小 约 为 41 X41 像素， 以 白 底 黑 字 方式 呈现 。 被 试 眼 睛 与 屏幕 之 间 的 距离 为 75 cm, 
每 个 汉字 约 为 1.1” 视 角 。 
2. 2.5 实验 程序 

实验 使 用 E-prime 2.0 编程 。 首先， 被 试 阅读 指导 语 理 解 实验 程 序 。 实 验 开始 时 ， 屏 幕 中 央 呈 现 “+” 
注视 点 ，800 ms 后 注视 点 消失 ， 接 着 呈现 一 个 词语 ， 被 试 需 快 而 准 地 进行 真 假 词 判断 ， 若 是 真 词 按 “F” 
键 ， 若 是 假 词 按 “J” 键 。 目 标 词 在 被 试 做 出 反应 或 3000 ms 后 消失 。 反 应 后 空 屏 600 ms 进入 下 一 试 次 。 
实验 材料 随机 呈现 ， 为 避免 练习 效应 按键 反应 在 左右 手 间 平衡 。 实 验 前 是 10 个 试 次 的 练习 ， 正 确 率 达 
90% 以 上 开始 正式 实验 ， 实 验 需 15 分 钟 。 实 验 流程 见 图 1. 


chinaXiv 


600ms 


3000ms 


图 1 实验 1 流程 图 . 


TE: 例 词 “ 消 失 ” 表 示 高 词 首 词素 位 置 概率 、 低 词尾 词素 位 置 概率 条 件 ， 即 “ 消 ” 词 首 词 素 位 置 概率 0.85, 


“ 失 ” 词 尾 词素 位 置 概率 0.24, 


2.3 实验 结果 


数据 分 析 时 ， 填 充 材 料 不 参与 分 析 。 数 据 分 析 过 程 中 删除 了 错误 反应 的 反应 时 数据 以 及 大 于 或 小 于 
3 个 标准 差 的 极端 值 ， 占 有 效 被 试 数据 的 1.296. 


2. 3.1 错误 率 


被 试 在 不 同 词素 位 置 概率 条 件 下 的 平均 错误 率 如 表 2 所 示 。 


D 
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表 2 不 同 词素 位 置 概率 条 件 下 的 平均 错误 率 


词素 位 置 概率 类 型 普 误 率 
高 词 首 -高 词尾 0.01 (0.11) 
高 词 首 - 低 词 尾 0.02 (0.14) 
氏 词 首 -高 词尾 0.02 (0.13) 
氏 词 首 - 低 词尾 0.02 (0.15) 


注 : 括号 内 为 标准 差 ， 以 下 同 。 


用 R 统计 软件 (R Development Core Team, 2017) 以 及 Ime4 工具 包 (Bates et al., 2017), 采用 广义 线性 


混合 模型 (Generalized Linear Mixed-effects Models, GLMMs) 对 错误 率 数据 进行 分 析 。 对 比 传统 的 方差 分 析 


(ANOVA), 线性 混合 


模型 将 全 部 原始 数据 纳入 模型 ， 数 据 利 用 率 更 高 ， 在 计算 数据 时 采用 最 大 随机 效应 


TS 


结构 ， 将 被 试 和 项 目 定义 为 交叉 随机 效应 (crossed random effects) 同 时 纳入 模型 ， 可 有 效 规避 被 试 分 析 (F1 


检验 ) 和 项 目 分 析 (F2 检验 ) 检 验 结果 不 一 致 的 情况 ， 使 计算 结果 更 加 统一 和 稳定 。 统 计 结 果 见 表 3。 


表 3 不 同 词素 位 置 概率 条 件 下 错误 率 的 线性 混合 模型 统计 结果 


Pe 错误 率 
模型 
b SE z 95% CI 
截 距 -9.32 1.37 -6.81°"* [-12.00, -6.64] 
词 首 词素 位 置 概率 0.45 1.29 0.35 [2.07, 2.97] 
词尾 词素 位 置 概率 1.38 1.29 1.07 [-1.15, 3.19] 
词 首 x 词 尾 词素 位 置 概率 -2.08 2.57 -0.81 [-7.11, 2.95] 
YE: “p<0.05, “p<0.01, ““p<0.001, LAF la]. Cl=Confidence Interval (置信 区 间 ) ， 以 下 同 。 


结果 显示 ， 词 首 词素 位 置 概 率 (z=0.35, p=0.73) 和 词尾 词素 位 置 概率 (z=1.07, p=0.29) 的 主 效应 均 不 显 


día 二 者 交互 作用 不 显著 (z=-0.81, p=0.42)。 结 果 表 明 高 频 词 条 件 下 词素 位 置 概 率 不 影响 被 试 的 错误 率 。 


2. 3.2 反应 时 


被 试 在 不 同 词素 位 置 概率 条 件 下 的 平均 反应 时 如 表 4 所 示 。 


X 4 不 同 词素 位 置 概率 条 件 下 的 平均 反应 时 (ms) 


词素 位 置 概率 类 型 反应 时 
高 词 首 -高 词尾 596 (166) 
高 词 首 - 低 词尾 608 (189) 

氏 词 首 -高 词尾 589 (153) 
氏 词 首 - 低 词尾 604 (184) 


注 : 反应 时 的 单位 是 ms， 括 号 内 为 标准 差 ， 以 下 同 。 
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模型 (Linear Mixed-effects Models, LMMs) 对 反应 时 数据 进行 分 析 ， 统 计 结 果 见 表 S. 


FAR 统计 软件 (R Development Core Team, 2017) 以 及 Ime4 工具 包 (Bates et al., 2017), 采用 线性 混合 


表 5 不 同 词素 位 置 概 率 条 件 下 反应 时 的 线性 混合 模型 统计 结果 


反应 时 
模型 
b SE t 95% CI 
截 距 637 0.02 37330" [6.33, 6.40] 
词 首 词素 位 置 概率 -0.01 0.02 -0.51 [-0.04, 0.02] 
词尾 词素 位 置 概率 0.02 0.01 1.19 [-0.01, 0.05] 
词 首 X 词 尾 词素 位 置 概率 0.01 0.03 0.18 [-0.05, 0.06] 


结果 显示 ， 词 首 词素 位 置 概率 ({=-0.51, p=0.62) 和 词尾 词素 位 置 概 率 (1=1.19, p=0.24) 的 主 效应 均 不 显 
; 二 者 交互 作用 不 显著 (t=0.18, p=0.86)。 结 果 说 明 高 频 词 条 件 下 首 、 尾 词素 位 置 概率 不 影响 词汇 识别 。 
2.4 讨论 
实验 la 结果 表明 , 加工 高 频 词 时 词 首 与 词尾 词素 位 置 概率 的 高 低 不 影响 被 试 反应 时 。 一 些 研究 提示 
词 频 可 影响 单词 的 表征 ， 高 频 词 由 于 常 一 起 呈现 ， 在 通达 表征 层 逐 渐 形 成 独立 表征 ;而 低频 词 可 能 依赖 
分 解 的 途径 通过 词素 进行 通达 ( 彭 聘 龄 等 , 1999)。 有 研究 指出 低频 双 字 词 识别 过 程 中 存在 词素 语义 激活 ， 
词素 意义 和 整 词 意义 之 间 相 互 作用 , 当 二 者 意义 相近 时 相互 促进 , 而 且 高 频 双 字 词 词素 语义 激活 不 明显 ， 
整 词语 义 的 激活 并 不 慢 于 词素 , 词素 通达 并 不 是 整 词 通达 的 必 经 阶段 ( 俞 林 讲 , 2006)。 另 有 实验 证 据 表 明 ， 
双 字 词 的 词 频 高 时 ， 词 素 频率 效应 不 显著 ， 即 词 频 与 词素 频率 的 作用 是 竞争 的 ， 但 词 频 发 挥 了 更 强 的 作 
用 ， 高 词 频 抑 制 了 词素 频率 的 效应 ( 王 德 强 , 2011)。 可 见 ， 词 素 的 特性 受到 整 词 属性 的 制约 。 
总 结 以 往 研 究 可 知 ， 与 高 频 预 测 性 目标 词 相 比 ， 读 者 在 加 工 低频 预测 目标 词 时 耗费 的 资源 更 多 ， 词 


汇 加 工 的 层次 也 更 深 ( 吴 琼 ,， 2013)。 来 自 拼 音 文字 的 研究 显示 ， 当 复合 词 为 长 词 (平均 12-13 个 字符 ) 时 ， 


n 


如 breastbone, 词素 breast 和 bone 的 词 频 会 影响 注视 词 的 加 工时 间 (Hy6ni et al., 2004); 当 复 合 词 变 成 短 
词 (平均 7~9 个 字符 ) 时 ,词素 词 频 的 作用 有 限 ,而 是 整 词 词 频 影响 目标 词 的 注视 时 间 。Li 和 Pollatsek(2020) 


认为 词汇 识别 是 从 视觉 信息 开始 ， 之 后 是 字 层 面 的 加 工 ， 最 后 是 词 层面 的 加 工 。 因 此 ， 字 层面 的 词素 位 
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置 概率 的 加 工 水 平 是 低 于 词汇 层面 的 ， 词 素 位 置 概率 信息 没有 词汇 层面 信息 的 丰富 性 。 如 在 高 频 或 高 预 
测 性 条 件 下 ， 读 者 可 能 更 依赖 整 词 词 频 或 整体 语 境 去 识别 词汇 。 对 比 而 言 ， 低 频 词 条 件 由 于 缺少 了 整 词 
提供 的 丰富 的 词汇 信息 ， 词 素 特性 得 以 展现 ， 此 时 词素 位 置 概率 信息 可 能 会 发 挥 作用 。 为 此 ， 当 目标 词 
变 为 低频 条 件 时 ， 是 否 存在 词素 位 置 概率 效应 ? 首 、 尾 词素 位 置 概率 信息 对 视觉 词汇 加 工 的 重要 程度 如 
何 ? 实验 lb 将 探究 在 低频 词 条 件 下 词素 位 置 概率 在 词汇 识别 中 的 作用 , 以 期 全 面 考察 整 词 词 频 对 词素 位 
置 概率 效应 的 影响 。 
3 实验 Db: 词素 位 置 概率 在 低频 词 词汇 识别 中 的 作用 
3.1 实验 目的 
采用 词汇 判断 任务 , 操纵 词 首 和 词尾 词素 位 置 概率 , 考察 在 低频 词 条 件 下 被 试 词汇 判断 的 成 绩 差 异 ， 
探究 词素 位 置 概率 线索 在 词汇 识别 中 的 作用 。 
3.2 实验 方法 
3. 2.1 被 试 

同 实验 1a。 


3.2.2 实验 设计 


R 


同 实 验 lao 
3. 2.3 实验 材料 
参照 中 国电 视 电 影 旁白 的 汉语 词汇 和 笔画 频率 语料库 (Cai & Brysbaert, 2010)， 为 保证 词素 位 置 概率 


条 件 的 区 分 度 ， 将 词素 位 置 概率 高 于 0.7 定义 为 高 概率 , 低 于 0.3 定义 为 低 概率 。 操 纵 词素 位 置 概率 的 高 
低 ， 共 选取 120 个 双 字 词 ， 将 其 分 为 四 种 条 件 (每 种 条 件 下 30 个 双 字 词 ): (1) 高 词 首 词素 位 置 概率 、 高 词 
尾 词素 位 置 概 率 ; (2) 高 词 首 词素 位 置 概率 、 低 词尾 词素 位 置 概率 ; (3) 低 词 首 词素 位 置 概率 、 高 词尾 词素 
位 置 概率 ; (4) 低 词 首 词素 位 置 概率 、 低 词尾 词素 位 置 概率 。 控制 四 种 条 件 下 双 字 词 的 词 频 (F(3, 116)=0.62， 
p=0.60)、 词 首 笔画 数 (F(3，116)=1.28, p=0.12)、 词 尾 笔画 数 (F(3，116)=0.74, p=0.52)、 词 首 字 频 (F703， 
116)=1.49, p=0.09) 和 词尾 字 频 (F(3, 116)=1.58, p=0.08) 的 差异 不 显著 。 考 虑 到 词素 结构 可 能 对 词汇 认 知 加 
工 造成 影响 ， 材 料 选取 时 尽 可 能 避免 选取 偏 正 复合 词 和 含有 词缀 的 双 字 词 。 同 时 ， 控 制 四 种 条 件 词 首 和 
词尾 的 构 词 能 力 之 间 差异 不 显著 ，#<1，ps>0.05。 此 外 ,请 15 名 不 参加 实验 的 同学 对 目标 词 的 熟悉 度 
和 语义 透明 度 进行 评定 ， 其 中 1 代表 “非常 不 熟悉 ”，5 代表 “非常 熟悉 ”，1-~5 的 变化 代表 词语 熟悉 
性 的 增强 ， 目 标 词 的 熟悉 度 为 M=3.98(SD=0.22); 语义 透明 度 指 的 是 复合 词 的 语义 能 从 其 各 个 组 成 词素 
的 语义 推 知 的 程度 。 其 中 1 代表 “完全 不 透明 词 ”，5 代表 “完全 透明 词 ”，1~5 的 变化 代表 语义 透明 
度 的 增强 ， 目 标 词 的 语义 透明 度 为 M=4.13(SD=0.35)。 其 中 ， 目 标 词 的 词 频 显著 低 于 实验 1a 中 目标 词 的 


词 频 (=-9.84，p 二 0.001)。 实 验 材 料 的 基本 参数 情况 见 表 6。 


表 6 实验 材料 的 基本 参数 情况 


词素 位 置 目标 词 WARR 词尾 词素 整 词 WIE 词尾 词 首 词尾 

概率 类 型 举例 位 置 概率 位 置 概率 词 频 笔画 数 笔画 数 字 频 字 频 
高 词 首 -高 词尾 。 消炎 0.83 (0.08) 0.80(0.08) 2.01(2.24) 9.53 (1.54) 9.56 (2.64) 174.69 (172.63) 165.10 (187.62) 
高 词 首 - 低 词 尾 “批改 0.82(0.09) 0.22(0.09) 1.81(2.19) 8.96(2.83) 9.73(2.98) 107.51(84.93) 105.10 (74.77) 
氏 词 首 -高 词尾 ”疗程 0.21 (0.06) 0.81(0.06) 2.02 (2.67) 9.33 (2.20) 8.83 (2.57) 177.33 (151.27) 177.38 (166.89) 
氏 词 首 - 低 词尾 SHE 0.25 (0.06) 0.26 (0.06) 1.74 (1.64) 8.06 (2.06) 9.66 (2.30) 226.33 (212.62) 234.87 (289.21) 


构成 
中 的 


为 平衡 词汇 判断 的 对 错 项 目 数 ， 在 实验 材料 中 加 入 了 填充 词 


的 假 词 ， 其 中 假 词 中 字 的 笔画 与 真 词 5 


FUZA RA EB, t=1.70, p>0.05. 


3.2.4 实验 仪器 


同 实验 la. 


3. 2.5 实验 程序 


3.3 


同 实验 1a。 


构成 了 “ 否 ” 反 应 。 填 充 词 是 由 真 字 


h 字 的 笔画 差异 不 显著 ，!<1，P>0.05;， 假 词 中 的 字 频 与 真 词 


数据 分 析 时 ， 填 充 材料 不 参与 分 析 。 数 据 分 析 过 程 中 删除 了 错误 反应 的 反应 时 数据 以 及 大 于 或 小 于 


实验 结果 
3 个 标准 差 的 极端 值 ， 占 有 效 被 试 数据 的 1 
1 错误 率 


3. 3. 


混合 模型 (Generalized Linear Mixed-effects Models, GLMMS) 对 错误 率 数据 进行 分 析 。 将 词 首 、 词 


置 概 


6% 。 


被 试 在 不 同 词素 位 置 概率 条 件 下 的 平均 错误 率 如 表 7 所 示 。 


表 7 不 同 词素 位 


词素 位 置 概率 类 型 


高 词 首 -高 词尾 
高 词 首 - 低 词 尾 
氏 词 首 -高 词尾 
氏 词 首 - 低 词尾 


使 用 R 统计 软件 (R Development Core Team, 2017) 以 及 lme4 T. 


RES 


F 下 的 平均 错误 率 


错误 率 
0.05 (0.21) 
0.06 (0.24) 
0.13 (0.31) 
0.13 (0.33) 


1 ,(Bates et al., 2017), X) 


I XE 


率 以 及 它们 之 间 的 交互 作用 作为 固定 因素 纳入 模型 进行 分 析 ， 统 计 结 果 见 表 S. 
表 8 不 同 词素 位 置 概率 条 件 下 错误 率 的 线性 混合 模型 统计 结果 
模型 错误 率 
b SE z 95% CI 
截 距 -2.77 0.17 = -16.28""* [-3.11, -2.44] 
词 首 词素 位 置 概率 1.08 0.09 11.58 [0.90, 1.26] 
词尾 词素 位 置 概率 0.15 0.09 1.57 [-0.04, 0.33] 
词 首 x 词 尾 词素 位 置 概率 -0.31 0.19 -1.69 [-0.68, 0.05] 


尾 词素 位 


由 统计 结果 可 见 ， 词 首 词素 位 置 概 率 的 主 效应 显著 (z=11 


58, p 二 0.001)， 词 尾 词 素 位 置 概率 的 主 效应 


不 显著 (z=1.57, p=0.11)， 词 首 和 词尾 词素 位 置 概率 的 交互 作 


词素 位 置 概 率 在 词汇 识别 中 起 了 显著 作用 。 
3. 3.2 反应 时 


不 显著 (z=-1.69, p=0.09)。 结 果 表 明 ， 词 首 


被 试 在 不 同 词素 位 置 概 率 条 件 下 的 平均 反应 时 如 表 9 所 示 。 


表 9 不 同 词素 位 置 概率 条 件 下 的 平均 反应 时 


司 素 位 置 概率 类 型 
高 词 首 -高 词尾 
高 词 首 - 低 词尾 
氏 词 首 -高 词尾 


ely 
n 


eR 


反应 时 
718 (205) 
736 (238) 
809 (287) 
790 (289) 


氏 词 首 - 低 词尾 


a 


使 


用 R 统计 软件 (R Development Core Team, 2017) 以 及 Ime4 工具 包 (Bates et al., 2017), 采用 线性 混合 


模型 (Linear Mixed-effects Models, LMMs) 对 反应 时 数据 进行 分 析 。 统 计 结 果 见 表 10. 


表 10 不 同 词素 位 置 概率 条 件 下 反应 时 的 


线性 混合 模型 统计 结果 


反应 时 
模型 
b SE t 95% CI 
截 距 6.61 0.02 360.14”™ [6.58, 6.65] 
词 首 词素 位 置 概率 0.10 0.02 5.22*** [0.06, 0.13] 
词尾 词素 位 置 概率 0.00 0.02 -0.03 [-0.05, 0.04] 
词 首 X 词 尾 词素 位 置 概率 -0.05 0.04 -1.34 [-0.13, 0.02] 


由 统计 结果 可 见 ， 词 首 词素 位 置 概率 的 主 效应 显著 (1=5.22, p 二 0.001)， 词 尾 词素 位 置 概率 的 主 效应 


AS Sit. % (t=-0.03, p=0.97)。 词 首 和 词尾 词素 位 置 概率 的 交互 作用 不 显著 (f=-1.34, p=0.19)。 结 果 表 明 ， 与 词 


尾 词素 位 置 概率 相 比 ， 词 首 词素 位 置 概 率 对 词汇 识别 的 作用 更 大 。 


3.3.3 词 首 词素 位 置 概率 和 反应 时 的 简单 线性 回归 模型 


实验 lb 的 结果 显示 , 被 试 的 反应 时 随 词 首 词素 位 置 概率 的 升降 而 变化 , 二 者 之 间 呈 现 出 一 定 程度 的 
相关 关系 。 为 了 检验 这 种 相关 关系 的 确切 程度 及 方向 性 ， 尝 试 根据 词素 位 置 概率 建立 读者 词汇 判断 反应 


时 的 最 优 


H 


归 模 型 ， 以 期 从 更 直观 的 线性 模型 视角 描述 词素 位 置 概率 与 词汇 加 工 的 关系 。 


(1) 建 立 简 单线 性 回归 模型 
运用 最 小 二 乘法 建立 简单 线性 回归 的 数学 模型 ; 


Y=B0+B1XI +e 
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公式 中 以 反应 时 为 因 变量 ， 词 首 词 素 位 置 概率 为 自 变量 ，0 为 常数 项 , 表示 截 距 项 参数 ;7 为 回归 
系数 ， 表 示 自 变量 X 每 变化 1 个 单位 时 ， 其 单独 引起 因 变 量 Y 的 平均 变化 量 ，s 为 随机 误差 项 ， 表 示 除 
影响 因素 X 以外, 其 他 所 有 影响 了 的 因素 。 借助 R 统计 软件 (R Development Core Team, 2017) 以 及 ggpubr 
工具 包 对 数据 进行 简单 线性 回归 分 析 ， 计 算 词 首 词素 位 置 概率 和 词汇 判断 反应 时 的 相关 性 ， 结 果 显 示 ， 
反应 时 与 词 首 词 素 位 置 概率 旺 显著 负 相 关 (r=-0.38, p 二 0.001)。 

(2) 整 体 回归 模型 的 显著 性 检验 
对 回归 模型 的 整体 做 显著 性 检验 ， 结 果 显 示 回 归 方 程 高 度 显 著 ，F(1,118)=19.93，P<0.001。 这 说 明 
反应 时 与 词 首 词素 位 置 概率 间 的 线性 回归 关系 密切 。 

(3) 回 归 系 数 的 显著 性 检验 

对 回归 系数 进行 显著 性 检验 ， 即 变量 系数 的 1 检验 。 以 反应 时 为 因 变 量 ， 以 词 首 词素 位 置 概 率 为 自 
变量 ， 经 由 R 数据 软件 建立 简单 线性 回归 方程 ， 统 计 结果 见 表 11 和 图 2。 


H 


H 


表 11 词 首 词素 位 置 概率 对 反应 时 的 简单 线性 回归 结果 
. 反应 时 
模型 
b SE t p 
截 距 848. 01 18. 46 45. 94 0. 000 
词 首 词 素 位 置 概率 -135. 13 30. 27 -4.47 0. 001 
1100- 
i? — 0.14, p«0.001 
. 
e. 
. 
1000 - . . 
e . 
z = e . . e e. 
8 
900- e = z^ 
e. 
. 
— 
tc 
800 - 
700 - 
600 - 


0.25 0.50 0.75 1.00 
initial 


S| 2 词 首 词素 位 置 概率 对 反应 时 的 简单 线性 回归 图 


YE: RT= 反 应 时 ，initial= 词 首 词素 位 置 概率 


由 表 11 和 图 2 的 结果 可 见 ， 模 型 的 回归 系数 显著 ， 为 此 得 出 估计 的 回归 方程 ; 
Y=-135.13X+848.01 

由 回归 方程 可 知 ， 词 首 词素 位 置 概率 与 反应 时 呈 显 著 负 相关 关系 ， 即 词 首 词素 位 置 概率 每 增加 1 个 
单位 ， 读 者 反应 时 减少 135.13 毫秒 ， 可 见 词 首 词素 位 置 概率 显著 影响 读者 的 词汇 加 工 。 这 启示 我 们 可 根 
据 词 素 位 置 概 率 来 预测 读者 的 反应 时 ， 这 对 中 文 读者 阅读 行为 的 探究 有 具有 现实 指导 意义 。 

3.4 讨论 

实验 lb 反应 时 数据 提示 , 词 首 词素 位 置 概 率 的 主 效应 显著 而 词尾 不 显著 , 即 不 论 双 字 词 词尾 词素 位 
置 概率 高 低 与 否 ， 只 要 词 首 词素 位 置 概率 高 时 ， 词 汇 判 断 时 间 便 显著 减少 。 错 误 率 数 据 进一步 表 定 了 词 
首 的 加 工 优势 。 同 时 ， 观 察 反 应 时 的 线性 回归 模型 发 现 ， 被 试 词汇 判断 的 反应 时 与 词 首 词素 位 置 概率 呈 
现 显著 的 负 相 关 关系 , 词 首 词素 位 置 概率 增加 , 词汇 判断 反应 时 减少 。Cui 等 人 (2014) 应 用 边界 范式 发 现 ， 
词 首 词素 字 频 的 识别 制约 着 词尾 词素 的 识别 ， 且 词尾 词素 语义 的 获得 还 受到 了 词 首 词素 字 频 的 调节 。 
Bertram 等 人 (2003) 发 现 与 词 首 词素 字 频 较 低 的 条 件 相 比 , 词 首 词素 字 频 较 高 时 复合 词 的 注视 时 间 显著 降 
低 。 后 续 研 究 进一步 巩固 了 词 首 词 素 的 主体 地 位 ， 长 复合 词 中 读者 首先 加 工 词 首 ， 然 后 加 工 词尾 ， 最 后 
加 工整 词 (Hy6nii et al., 2004; Pollatsek & Hyónà, 2005). 

中 文 阅读 研究 认为 词汇 加 工 早 期 阶段 是 词素 层次 的 通达 ， 词 素 身份 信息 起 主要 作用 ， 晚 期 是 整 词 的 
Ke, px SJ RERIGAHES 等 , 1999)， 词 素 身 份 信息 确定 后 读者 开始 加 工 词素 的 位 置信 息 ， 
而 单独 呈现 双 字 词 时 ， 词 素 位 置信 息 的 重要 性 在 早期 阶段 表现 明显 (吴琼 ，2013)， 当 词素 经 常 出 现在 某 
一 位 置 时 ， 则 对 词素 位 置 产 生 了 期 待 。 例 如 ，“ 批 ” 字 组 成 的 复合 词 中 其 常 出 现在 词 首 ， 如 “批改 ”、 
“批评 ”, 读者 在 学 习 和 阅读 过 程 中 常 接受 这 一 讯息 , 加 深 了 心理 词典 中 “ 批 ” 居于 词 首 的 印象 , 对 “ 批 ” 
位 于 词 首 也 产生 更 多 期 待 。 当 看 到 “批改 ”时 ， 词 首 “ 批 ”被 激活 的 同时 所 携带 的 高 词素 位 置 概率 特征 
亦 被 激活 。 此 时 ， 如 果 被 试 觉察 到 当前 汉字 实际 位 置 与 期 望 位 置 相符 ， 词 的 激活 水 平 比较 高 ， 词 汇 识 别 
时 间 较 短 。 一 旦 读者 发 现 当前 汉字 实际 位 置 与 期 望 位 置 相 矛盾 ， 如 “ 批 ” 字 出 现在 不 常 出 现 的 词尾 位 置 ， 
组 成 “分 批 ”一 词 ， 被 试 需 花费 额外 的 认 知 资源 处 理 这 一 冲突 ， 词 汇 识 别 时 间 延 长 。 综 上 ， 低 频 词 条 件 
下 词素 特征 信息 得 以 表达 ， 而 加 工 高 频 词 的 词素 位 置 概率 信息 时 ， 其 词素 语义 激活 相对 较 弱 ， 以 整 词 形 
式 完 成 了 词汇 识别 ， 为 此 词素 提供 的 位 置 概率 信息 被 掩盖 。 两 个 实验 以 词汇 判断 的 方式 独立 呈现 双 字 词 
的 词素 位 置 ， 一 般 而 言 读 者 是 在 句子 中 理解 词汇 ， 那 么 ， 在 贴近 自然 阅读 的 句子 中 ， 词 素 位 置 概率 是 否 
还 会 发 生 作用 ? 首 、 尾 词素 位 置 概率 作用 的 发 挥 是 否 一 致 ? 实验 2a 将 探索 处 于 生态 效 度 更 高 的 自然 阅读 
中 词素 位 置 概 率 的 现实 效用 。 


4 实验 2a: 高 频 词 条 件 下 词素 位 置 概率 在 句子 阅读 中 的 作用 


4.1 实验 目的 


T 


通过 操纵 词 首 和 词尾 的 词素 位 置 概率 的 高 低 ， 进 一 步 考察 在 自然 阅读 过 程 中 词素 位 置 概率 线索 是 否 
会 影响 被 试 的 词汇 识别 与 切 分 。 
4. 2 实验 方法 
4.2.1 被 试 

60 名 天 津 师范 大 学 在 校 学 生 , 其 中 女生 42 44, 男生 18 名 , 年 龄 在 18-24 岁 之 间 (M=19.33, SD=1.54). 
被 试 均 为 汉语 母语 者 ， 视 力 或 矫正 视力 正常 ， 均 不 知 实验 目的 ， 实 验 结束 可 获得 一 定 报 酬 。 
4. 2.2 实验 设计 

采用 2( 词 首 词素 位 置 概率 : 高 、 低 )X2( 词 
4.2.3 实验 材料 

参照 中 国电 视 电 影 稼 白 的 汉语 词汇 和 笔画 频率 语料库 (Cai & Brysbaert, 2010)， 为 保证 词素 位 置 概率 
条 件 的 区 分 度 ， 将 词素 位 置 概率 高 于 0.7 定义 为 高 概率 , 低 于 0.3 定义 为 低 概率 。 操 纵 词 素 位 置 概率 的 高 
低 ， 共 选取 96 个 双 字 词 ， 将 其 分 为 四 种 条 件 (每 种 条 件 下 24 个 双 字 词 ): (1) 高 词 首 词素 位 置 概率 、 高 词 
尾 词素 位 置 概率 ; (2) 高 词 首 词素 位 置 概率 、 低 词尾 词素 位 置 概率 ; (3) 低 词 首 词素 位 置 概率 、 高 词尾 词素 
位 置 概率 ; (4) 低 词 首 词素 位 置 概率 、 低 词尾 词素 位 置 概率 。 控 制 四 种 条 件 下 双 字 词 的 词 频 差 异 不 显著 (F(3， 
92)=0.23, p=0.87)、 词 首 笔画 数 差 异 不 显著 (F(3, 92)=1.43, p=0.23)、 词尾 笔画 数 差 异 不 显著 (F(3, 92)=1.11, 
尾 字 频 (F(3, 92)=0.18, p=0.90) 的 差异 不 显著 。 考 虑 到 词素 结 
构 可 能 对 词汇 认 知 加 工 造成 影响 ， 材 料 选取 时 尽 可 能 避免 选取 偏 正 复合 词 和 含有 词缀 的 双 字 词 。 同 时 ， 
制 四 种 条 件 词 首 和 词尾 的 构 词 能 力 之 间 差 异 不 显著 ,fs 过 1,， ps>0.05. 请 15 名 不 参加 实验 的 同学 评定 
目标 词 的 熟悉 度 和 语义 透明 度 ， 其 中 1 代表 “非常 不 熟悉 ”，5 代表 “非常 熟悉 ”，1~5 的 变化 代表 词 
语 熟悉 性 的 增强 ， 目 标 词 的 熟悉 度 为 M=4.31(SD=0.12);， 语义 透明 度 指 的 是 复合 词 的 语义 能 从 其 各 个 组 


成 词素 的 语义 推 知 的 程度 。 其 中 1 代表 “完全 不 透明 词 ”，5 代表 “完全 透明 词 ”，1~5 的 变化 代表 语 


尾 词素 位 置 概率 : 高 、 低 ) 的 两 因素 被 试 内 重复 测量 设计 。 


i 


p=0.35)、 词 首 字 频 (F(3, 92)=0.89, p=0.44) 和 词 


Br 


义 透 明度 的 增强 ， 目 标 词 的 熟悉 度 为 M=4.24(SD=0.35)。 实 验 材料 的 基本 情况 见 表 12. 
表 12 实验 材料 的 基本 情况 
词素 位 置 词 首 词素 ”词尾 词素 qi] uH 词尾 ig 词尾 
概率 类 型 位 置 概 率 位 置 概率 词 频 笔画 数 笔画 数 字 频 uu 
高 词 首 -高 词尾 0.81 (0.10) 0.78 (0.10) 50.46 (21.72) 9.29 (2.14) 9.83 (3.63) 265.66 (219.63) — 259.35 (252.95) 
高 词 首 - 低 词尾 0.81 (0.11) 0.29 (0.13) 56.11 (54.55) 9.33 (1.99) 8.54 (2.78) 224.31 (190.04) 292.32 (222.27) 
氏 词 首 - 高 词尾 0.25 (0.05) 0.77 (0.09) 51.94 (41.73) 9.38 (2.76) 8.25 (2.65) 318.66 (200.94) — 309.66 (239.24) 
氏 词 首 - 低 词尾 0.27 (0.06) 0.29 (0.16) 46.77 (28.73) 8.08 (3.17) 8.29 (2.42) 307.86 (270.44) 297.05 (252.72) 
依据 目标 词 编制 句子 ,目标 词 出 现在 句子 中 间 位 置 ， 句子 长 度 在 1820 个 汉字 之 间 。 请 15 名 不 参加 
正式 实验 的 大 学 生 评定 句子 的 通顺 性 ， 从 1“ 非 常 不 通顺 ”到 5“ 非 常 通 顺 ”， 平 均 通顺 性 为 
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M=4.22(SD=0.28)。 选 取 15 名 不 参加 正式 实验 的 大 学 生 对 句子 的 难度 进行 5 级 评定 ， 从 1“ 非 常 简单 ” 
到 5“ 非 常 难 ”， 平 均 难 度 为 M=1.86(SD=0.21)。 同 时 ， 对 双 字 词 词 首 和 词尾 的 构 词 能 力 进行 控制 ， 四 
种 条 件 首 、 尾 的 构 词 能 力 差 异 不 显著 ,ts 二 1，ps0.05。 男 选取 15 名 不 参加 正式 实验 的 大 学 生 对 句子 的 
预测 性 进行 评定 。 预 测 性 评定 采用 补充 句子 的 方式 ， 即 将 实验 句 中 目标 词 及 以 后 的 内 容 删 除 ， 让 被 试 依 
据 所 剩 的 部 分 将 句子 补充 完整 。 如 果 被 试 所 填 内 容 与 目标 词 一 致 ， 则 表明 预测 成 功 ， 计 1 分 ， 和 否则 表明 
预测 失败 ， 计 0 分 。 经 计算 ,句子 的 平均 预测 性 为 : M=0.012(SD=0.42)， 说 明 目 标 词 的 可 预测 性 非常 低 。 
为 了 避免 被 试 对 实验 句 形 成 反应 定 势 ， 在 阅读 材料 中 随机 插入 填充 句 。 采 用 拉丁 方 平衡 设计 将 实验 材料 


分 为 4 个 Block， 每 一 个 Block 包含 4 个 练习 句 、24 个 实验 句 和 24 个 填充 句 。 实 验 材 料 举 例如 表 13. 
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表 13 实验 材料 举例 
词素 位 置 概率 类 型 ”目标 词 例句 


高 词 首 - 高 词尾 遗憾 参赛 队员 们 说 这 种 遗憾 是 别人 很 难 体会 的 。 
高 词 首 - 低 词尾 享受 参赛 队员 们 说 这 种 享受 是 别人 很 难 体会 的 。 
氏 词 首 -高 词尾 责任 参赛 队员 们 说 这 种 责任 是 别人 很 难 体 会 的 。 
氏 词 首 - 低 词 尾 想念 参赛 队员 们 说 这 种 想念 是 别人 很 难 体会 的 。 
TE: 加 粗 字 体 为 目标 词 ， 在 实验 中 均 以 正常 形式 呈现 。 


4. 2.4 实验 仪器 

采用 Eyelink 1000 plus 眼 动 仪 ， 采 样 频率 1000 Hz。 显 示 器 分 辨 率 为 1920X1080， 刷 新 率 140 Hz. 
被 试 与 屏幕 相距 75 cm。 实 验 材料 的 汉字 为 32 号 宋体 ， 汉 字 为 41 X41 RR, AE 0.75” 视 角 。 
4. 2.5 实验 程序 

每 个 被 试 单独 施 测 。 首 先 ， 主 试 讲解 指导 语 确保 被 试 理解 实验 过 程 。 开始 前 对 眼 动 仪 进行 三 点 校准 ， 
平均 误差 小 于 03. 之 后 被 试 阅读 屏幕 上 的 句子 , 句子 呈现 前 屏幕 左 侧 出 现 注 视点 “十 ”， 要 求 盯 住 “ 十 ” 
触发 句子 阅读 。 实 验 包括 4 个 练习 句 ，24 个 实验 句 ，24 个 填充 句 ， 其 中 14 个 句子 后 面 有 简单 的 “是 ” 
或 “ 否 ” 的 判断 题 ，“ 是 ”或 “和 否 ” 的 判断 各 占 一 半 ， 以 确保 被 试 认真 阅读 句子 。 实 验 材料 逐 屏 呈现 ， 
被 试 阅读 完 一 屏 后 按 空格 键 进入 下 一 个 句子 。 实 验 过程 中 每 读 完 五 个 句子 做 一 次 三 点 校准 ， 其 他 每 个 句 
子 做 一 点 校准 。 主 试 实时 监视 眼 动 仪器 必要 时 进行 重新 校准 ， 整 个 实验 大 约 15 分 钟 。 
4. 2.6 分 析 指 标 

参照 以 往 研究 (Liang et al, 2015)， 选 取 首 次 注视 时 间 、 凝 视 时 间 、 回 视 路 径 时 间 和 总 注视 时 间 进 行 
分 析 。 首 次 注视 时 间 是 指 首 次 通过 兴趣 区 的 首 个 注视 点 的 注视 时 间 ， 与 兴趣 区 内 有 多 少 注视 点 无 关 ; Bik 
视 时 间 是 指 从 首次 注视 开始 到 注视 点 第 一 次 离开 所 在 兴趣 区 之 间 的 持续 时 间 ; 回 视 路 径 时 间 是 指 从 首次 
注视 开始 ， 到 注视 点 落 到 所 注视 兴趣 区 的 右 侧 区 域 为 止 (不 包括 右 侧 区 域 这 一 注视 点 )， 之 间 所 有 注视 点 
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TERES [ROS AA RL ASAE ULSD TRI A TH VE CE P488 A A AE RP SE OT TRI BASE. SE, PEE AULT [REI 
凝视 时 间 是 反映 词汇 通达 早期 阶段 特征 的 有 效 指标 ， 回 视 路 径 时 间 既 能 反映 词汇 通达 的 过 程 ， 还 可 反映 
词汇 后 期 加 工 和 语义 的 整合 过 程 ， 总 注视 时 间 反 映 的 是 词汇 加 工 的 总 体 过 程 ( 闫 国 利 等 , 2013)。 
4. 3 实验 结果 

被 试 正确 率 在 83% 以 上 (SD=4.29)， 说 明 其 认真 阅读 了 句子 。 参 考 以 往 研 究 的 数据 删除 标准 (Rayner， 
2009): (1) 删 除 注视 点 持续 时 间 小 于 80 ms 或 大 于 1200 ms 的 注视 点 (1.9%)。(2) 删 除 单个 句子 注视 点 少 于 


5 个 的 试 次 或 追踪 丢失 的 数据 (0.42%)。 基 于 R 语言 环境 (R Core Team，2017) 下 的 线性 混合 模型 (Linear 


Id 


Mixed-effects Models, LMMs) 和 Ime4 数据 包 统 计数 据 (Bates et al., 2017)。 分 析 时 对 注视 时 间 进 行 了 log 转 
换 ， 将 首 、 尾 词素 位 置 概率 及 其 交互 作用 作为 固定 效应 纳入 模型 ， 被 试 和 项 目 作 为 交叉 随机 效应 。 首 先 
从 最 大 效应 模型 开始 ， 若 模型 无 法 拟 合 则 依次 简化 最 大 模型 直至 拟 合 。 不 同 词素 位 置 概率 条 件 下 眼 动 指 
标的 描述 统计 结果 见 表 14， 线 性 混合 模型 统计 结果 见 表 15。 


表 14 不 同 词素 位 置 概率 条 件 下 眼 动 指标 的 描述 统计 结果 


词素 位 置 概率 类 型 ”首次 注视 时 间 (ms) ”凝视 时 间 (ms) ” 回 视 路 径 时 间 (ms) ”总 注视 时 间 (ms) 


高 词 首 -高 词尾 242 (78) 267(101) 330 (226) 370 (226) 
高 词 首 - 低 词 尾 252 (91) 279 (126) 364 (381) 398 (258) 
氏 词 首 -高 词尾 246 (78) 274 (123) 345 (264) 384 (227) 
氏 词 首 - 低 词尾 244 (87) 268 (115) 338 (234) 398 (268) 
表 15 不 同 词素 位 置 概率 条 件 下 线性 混合 模型 的 统计 结果 
分 析 指 标 效应 b SE t 95% CI 

词 首 词素 位 置 概率 -0.01 0.02 -0.14 [-0.04, 0.04] 

首次 注视 时 间 词尾 词素 位 置 概率 0.00 0.02 0.21 [-0.04, 0.05] 

词 首 X 词 尾 词素 位 置 概率 -0.04 0.04 -1.01 [-0.12, 0.04] 

词 首 词素 位 置 概率 -0.01 0.03 -0.39 [0.06, 0.04] 

凝视 时 间 词尾 词素 位 置 概率 0.00 0.03 -0.17 [-0.06, 0.05] 

词 首 X 词 尾 词素 位 置 概率 -0.05 0.05 -0.93 [-0.15, -0.05] 

词 首 词素 位 置 概率 0.00 0.04 0.06 [-0.06, 0.07] 

可 视 路 径 时 间 词尾 词素 位 置 概率 0.00 0.04 0.02 [0.07, 0.07] 

词 首 X 词 尾 词素 位 置 概率 -0.05 0.07 -0.70 [-0.19, 0.09] 

词 首 词素 位 置 概率 0.03 0.04 0.67 [-0.05, 0.11] 

总 注视 时 间 词尾 词素 位 置 概率 0.02 0.04 0.69 [-0.06, 0.11] 

词 首 X 词 尾 词素 位 置 概率 -0.03 0.08 -0.38 [-0.20, 0.13] 


根据 线性 混合 模型 的 统计 结果 ， 词 首 词素 位 置 概率 在 首次 注视 时 间 (f=-0.14, p=0.89)、 凝 视 时 间 


(t=-0.39, p=0.70)、 回 视 路 径 时 间 (1=0.06, p=0.95) 以 及 总 注视 时 间 (1=0.67, p=0.51) 上 的 主 效应 不 显著 ; 词尾 
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WARMER EE OE LY TF (120.21, p=0.84)、 凝 视 时 间 (=-0.17, p=0.86). IIBER EEN [R1 (150.02, p=0.99) 


及 总 注视 时 间 (=0.69, p=0.50)_E WUE SUM ANE E. FERT RR ESE CE LY TA (t=-1.01, p=0.32)、 


凝视 时 间 (=-0.93, p=0.36). [ALLER ZEN Tal (t=-0.70, p=0.49) & RAVE RUF] [8] (t=-0.38, p=0.71) 的 交互 作用 不 显 
著 。 研 究 结果 表明 ， 高 频 词 条 件 下 词素 位 置 概率 未 影响 读者 的 阅读 行为 。 
4.4 讨论 

实验 2a 结果 表明 ， 当 目标 词 为 高 频 词 时 , 词 首 与 词尾 不 同 词素 位 置 概率 水 平 下 的 注视 时 间 没 有 显著 
差异 。 同 时 ， 综 合 实验 la 和 lb 的 结果 发 现 ， 当 目标 词 为 低频 时 ， 读 者 能 利用 词 首 词素 位 置 概率 线索 指 
导 阅 读 ， 而 目标 词 变 为 高 频 时 ， 词 首 词素 位 置 概率 不 再 显著 影响 阅读 进程 ， 这 个 结果 与 复合 词 混合 通达 
表征 模型 的 观点 较为 吻合 。Caramazza 等 人 (1988) 提 出 的 混合 通达 表征 模型 (Augment Addressed 
Morphology) 认 为 ， 词 汇 识 别 时 既 存在 单独 的 词素 表征 ， 也 存在 整 词 表 征 ， 词 汇 识 别 是 词素 与 整 词 激活 并 
相互 作用 的 结果 。 例 如 ， 加 工 “walked” 可 激活 “walked”“talked” 等 整 词 ， 也 可 激活 “walk”、“ed” 
这 样 的 词素 ， 整 词 与 词素 谁 先 达到 激活 阔 限 谁 便 在 竞争 中 胜出 。 为 此 ， 对 于 新 词 或 低频 词 ， 由 于 在 通达 
表征 中 没有 相对 应 的 整 词 表征 ， 而 是 相应 的 词素 被 激活 ， 词 素 单元 在 竞争 中 更 易 胜 出 ， 而 后 词素 所 携带 
的 位 置 概率 特征 可 能 被 激活 :而 对 于 熟悉 的 高 频 词 ， 其 组 成 成 分 经 常 同时 出 现 ， 倾 向 形成 独立 的 识别 单 
元 ， 由 此 整 词 更 易 被 激活 继而 通达 了 语义 ， 这 样 的 话 ， 可 能 会 减少 词素 位 置 概率 提取 或 使 用 的 机 会 ， 词 
素 携 带 的 位 置 概率 信息 未 得 到 充分 表达 。 为 此 , 实验 2b 将 探究 含 词素 位 置 概率 信息 的 低频 目标 词 置 于 名 
子 中 的 眼 动 规律 ， 进 一 步 厘 清 首 、 尾 词素 位 置 概率 在 词汇 加 工 中 的 重要 性 。 
5 实验 2b: 低频 词 条 件 下 词素 位 置 概率 在 句子 阅读 中 的 作用 
5.1 实验 目的 和 假设 

通过 操纵 词 首 和 词尾 的 词素 位 置 概率 的 高 低 ， 考 察 在 低频 词 条 件 下 词素 位 置 概 率 线索 是 否 会 影响 被 
试 的 词汇 识别 与 切 分 。 
5.2 实验 方法 
5. 2.1 被 试 

同 实验 2a。 
5.2.2 实验 设计 

同 实验 2a。 
5. 2.3 实验 材料 

参照 中 国电 视 电 影 旁 白 的 汉语 词汇 和 笔画 频率 语料库 (Cai & Brysbaert, 2010)， 为 保证 词素 位 置 概率 
条 件 的 区 分 度 ， 将 词素 位 置 概率 高 于 0.7 定义 为 高 概率 , IRF 0.3 定义 为 低 概率 。 操 纵 词 首 与 词尾 词素 位 
置 概率 的 高 低 ， 将 128 个 双 字 词 分 为 四 种 条 件 (每 种 条 件 下 32 个 双 字 词 ): (1) 高 词 首 词素 位 置 概率 、 高 词 


尾 词素 位 置 概率 ; (2) 高 词 首 词素 位 置 概率 、 低 词尾 词素 位 置 概率 ; (3) 低 词 首 词素 位 置 概率 、 高 词尾 词素 
位 置 概率 ; (4) 低 词 首 词 素 位 置 概率 、 低 词尾 词素 位 置 概率 。 控 制 每 一 种 条 件 下 双 字 词 的 词 首 笔画 数 与 词 


尾 笔画 数 、 词 首 字 频 与 词尾 字 频 的 差异 不 显著 (1(62) 二 1,，p 之 0.05)。 控 制 四 种 条 件 下 双 字 词 的 词 频 差异 不 


显著 (F(3, 124)=0.75, p=0.52)、 词 首 笔画 数 差 异 不 显著 (F(3，124)=0.83，p=0.47)、 词 尾 笔 画 数 差异 不 显著 


(F(3, 124)=0.94, p=0.42)、 词 首 字 频 (F(3, 124)=0.92, p=0.43) 和 词尾 字 频 (F(3, 124)=1.88, p=0.10) 的 差异 不 显 
著 。 考 虑 到 词素 结构 可 能 对 词汇 认 知 加 工 造成 影响 ， 材 料 选取 时 尽 可 能 避免 选取 偏 正 复 合 词 和 含有 词 级 
的 双 字 词 。 同 时 ， 控 制 四 种 条 件 词 首 和 词尾 的 构 词 能 
名 不 参加 实验 的 同学 对 目标 词 的 熟悉 度 和 语义 透明 度 进 行 评 定 ， 其 中 1 代表 “非常 不 熟悉 ”，5 代表 “ 非 
常熟 悉 ”，1~5 的 变化 代表 词语 熟悉 性 的 增强 ， 目 标 词 的 熟悉 度 为 M=4.06(SD=0.19); 语义 透明 度 指 的 是 

合 词 的 语义 能 从 其 各 个 组 成 词素 的 语义 推 知 的 程度 。 其 中 1 代表 “完全 不 透明 词 ”，5 代表 “完全 透 
明 词 ”，1~5 的 变化 代表 语义 透明 度 的 增强 ， 目 标 词 的 语义 透明 度 为 M=4.15(SD=0.11)。 其 中 ， 目 标 词 的 


词 频 显著 低 于 实验 2a 中 目标 词 的 词 频 (=-10.49，Pp<0.001)。 实 验 材 料 的 基本 情况 见 表 16。 


ZEAE, ts<1, ps>0.05. Ea, 请 15 


表 16 实验 材料 基本 情况 


词素 位 置 词 首 词素 词尾 词素 整 词 词 首 词尾 词 首 词尾 
概率 类 型 位 置 概率 位 置 概率 词 频 笔画 数 笔画 数 字 频 字 频 
高 词 首 - 高 词尾 。 0.82 (0.08)  0.80(008)  2.17(227) 9.56(1.50) 9.53 (2.57) 180.74 (174.92) 167.83 (181.91 ) 
高 词 首 - 低 词尾 。 0.82 (0.09) 0.22(0.07) 1.78(2.13) 9.03 (2.76) 9.65(2.92) 122.10 (161.87) 101.44(74.51) 
氏 词 首 - 高 词尾 。 0.21 (0.06) 0.81(0.09) 2.37(3.12)  925(215) 8.84(2.68)  177.50(150.80) 202.61 (190.59 ) 
氏 词 首 - 低 词 尾 。 0.25 (0.06) 0.26(0.06) 1.57(1.74) 8.68(2.49) 9.96(2.83) 154.64(147.35) 194.69 (229.69 ) 
依据 目标 词 编制 句子 ,目标 词 出 现在 句子 的 中 间 位 置 ， 句子 长 度 在 18-20 个 汉字 之 间 。 选 取 15 名 不 


参加 正式 实验 的 大 学 生 对 句子 的 通顺 性 


对 句子 的 预测 性 


FE 复合 词 和 含有 词 


进行 评定 。 预 测 性 评定 采用 补充 句子 的 方 


进行 5 级 评定 ， 从 1 “非常 不 通顺 ”到 5“ 非 常 通顺 ”， 平 均 通 
顺 性 为 WM=4.01(SD=0.32)。 选 取 15 名 不 参加 正式 实验 的 大 学 生 对 句子 的 难度 进行 5 级 评定 ， 从 1“ 非 
常 简单 ”到 5“ 非 常 难 ”， 平 均 难度 为 M=1.89(SD=0.21)。 考 虑 到 词素 结构 可 能 对 词汇 认 知 加 工 造成 影 
响 ， 保 证 实验 选取 的 词汇 材料 词素 与 整 词语 义 关联 程度 相同 ， 并 避免 选取 偏 
词 。 另 外 , 选取 15 名 不 参加 正式 实验 的 大 学 4 
式 ， 即 将 实验 句 中 


的 双 字 


目标 词 及 以 后 的 内 容 删 除 ， 让 被 试 依据 所 剩 的 部 分 将 句子 补充 完整 。 如 果 被 试 所 填 内 


容 与 目标 词 一 致 ， 则 表明 预测 成 功 ， 计 1 分 ; 否则 表明 预测 失败 ， 计 0 分 。 经 计算 ， 句 子 的 平均 预测 性 


为 : M=0.009(SD=0.38)， 说 明 目 标 词 的 可 预测 虱 
材料 中 随机 插入 填充 句 。 采 月 


fj. 32 个 实验 句 和 32 个 填充 句 。 实 验 材料 举例 如 表 17。 


FE 非 常 低 。 为 了 避免 被 试 对 实验 句 形 成 反应 定 势 ， 在 阅读 


拉丁 方 平衡 设计 将 实验 材料 分 为 4 个 Block， 每 一 个 Block 包含 4 个 练习 


A7 实验 材料 举例 


词素 位 置 概率 类 型 标 词 例句 
高 词 首 - 高 词尾 钢丝 这 堂 课 吴 老 师 重 点 讲解 了 钢丝 的 实际 用 处 。 
高 词 首 - 低 词 尾 蒸汽 这 堂 课 吴 老师 重点 讲解 了 蒸汽 的 实际 用 处 。 
氏 词 首 - 高 词尾 票据 这 堂 课 吴 老师 重点 讲解 了 票据 的 实际 用 处 。 
氏 词 首 - 低 词尾 妇联 这 堂 课 吴 老师 重点 讲解 了 妇联 的 实际 用 处 。 
YE: 加 粗 字 体 为 目标 词 ， 在 实验 中 均 以 正常 形式 呈现 。 
5. 2.4 实验 仪器 
同 实验 2a。 
5. 2.5 实验 程序 
同 实验 2a。 
5. 2.6 分 析 指 标 
同 实验 2a。 
5. 3 实验 结果 
所 有 被 试 正确 率 均 在 85% 以 上 (SD=5.9%), 说 明 被 试 都 认真 阅读 了 实验 材料 并 且 理 解 了 句子 的 内 容 。 


参考 以 往 研究 的 数据 删除 标准 (Rayner, 2009) 对 眼 动 数据 进行 整理 : (1) 删 除 注视 点 持续 时 间 小 于 80 ms 或 


大 于 1200ms 的 注视 点 (2.1%)。(2) 删 除 单个 句子 上 的 注视 点 总 数 少 于 5 个 的 试 次 或 者 追踪 丢失 的 数 


" 


(0.68%)。 有 眼 动 数据 基于 R 语言 环境 (R Core Team, 2017) 下 的 线性 混合 模型 (Linear Mixed-effects Models, 


LMMs) 和 Ime4 数据 包 进 行 统计 (Bates et al., 2017)。 数 据 分 析 时 对 注视 时 间 指 标的 数据 进行 了 log 转换 


将 词 首 与 词尾 词素 位 置 概率 以 及 它们 之 间 的 交互 作用 作为 固定 效应 纳入 模型 ， 


对 于 因 变 量 指标 ， 模 型 的 


建立 以 被 试 和 项 


LI 
Ly 


变异 (Baayen et al., 2008). te AU GIN 


目 作 为 交叉 随机 效应 。 
事后 分 布 的 模型 参数 来 作为 显著 性 的 估计 值 ， 这 
首先 从 最 大 效应 模型 开始 ,， 若 复杂 模型 无 法 拟 合 则 依次 简化 最 大 模 


lt. 


应 用 马尔 可 夫 链 蒙 


a 


-EZ (Markov-Chain Monte Carlo) 的 算法 得 


统计 和 


法 的 优势 是 可 以 同时 反映 来 自 被 试 和 项 目的 


型 直至 模型 能 够 拟 合 。 不 同 条 件 下 了 眼 动 指标 的 描述 性 统计 结果 见 表 18， 线 性 混合 模型 统计 结果 见 表 19. 


表 18 不 同 词素 位 置 概率 条 件 下 眼 动 指标 的 描述 统计 结果 
词素 位 置 概率 类 型 首次 注视 时 间 ms) 凝视 时 间 (ms) 回 视 路 径 时 间 (ms) 总 注视 时 间 (ms) 
高 词 首 -高 词尾 264 (101) 347 (223) 432 (301) 478 (333) 
高 词 首 - 低 词 尾 270 (106) 356 (222) 431 (294) 484 (339) 
氏 词 首 -高 词尾 278 (100) 381 (231) 468 (331) 528 (341) 
氏 词 首 - 低 词尾 271 (104) 357 (219) 478 (357) 508 (365) 


X19 不 同 词素 位 置 概率 条 件 下 线性 混合 模型 的 统计 结果 


分 析 指 标 效应 b SE t 95% CI 
词 首 词素 位 置 概率 0.03 0.02 1.65 [0.00, 0.06] 

首次 注视 时 间 词尾 词素 位 置 概率 -0.01 0.02 -0.39 [0.04, 0.03] 
词 首义 词尾 词素 位 置 概率 -0.06 0.04 -1.57 [-0.12, 0.01] 

词 首 词素 位 置 概率 0.05 0.02 2.01* [0.00, 0.10] 

凝视 时 间 词尾 词素 位 置 概率 -0.02 0.03 -0.60 [-0.08, 0.04] 
词 首 X 词 尾 词 素 位 置 概率 -0.11 0.05 -2.18" [-0.21, -0.01] 

词 首 词素 位 置 概率 0.08 0.03 2.65* [0.02, 0.13] 

可 视 路 径 时 间 词尾 词素 位 置 概率 0.00 0.03 0.00 [0.06, 0.06] 
词 首 X 词 尾 词 素 位 置 概率 -0.02 0.07 -0.29 [-0.17, 0.12] 

词 首 词素 位 置 概率 0.08 0.03 3.03** [0.03, 0.13] 

总 注视 时 间 词尾 词素 位 置 概率 -0.02 0.03 -0.49 [0.08, 0.05] 
词 首 义 词尾 词素 位 置 概率 -0.08 0.08 -1.10 [-0.23, 0.07] 


根据 线性 混合 模型 的 统计 结果 , 词 首 词素 位 置 概率 在 凝视 时 间 (=2.01, p=0.05). 回 视 路 径 时 间 (1=2.65， 


p=0.01)、 总 注视 时 间 (=3.03, p=0.004) 上 的 主 效应 显著 。 词 尾 词 素 位 置 概 率 在 首次 注视 时 间 (f=-0.39,， 


p=0.69)、 凝 视 时 间 (=-0.60, p=0.55)、 回 视 路 径 时 间 (f=0.00, p=0.99)、 总 注视 时 间 (=-0.49, p=0.63) 上 的 主 


效应 均 不 显著 。 词 首 与 词尾 词素 位 置 概率 交互 作用 在 凝视 时 间 上 尼 著 (f=-2.18, p=0.03)， 在 首次 注视 时 间 


(t=-1.57, p=0.12). [LAUER EEN [8] (t=-0.29, p=0.77)、 总 注视 时 间 ({=-1.10, p=0.28) 上 的 交互 作用 均 不 显著 。 


a 


针对 词 首 与 词尾 词素 位 置 概率 在 首次 注视 时 间 、 回 视 路 径 时 间 、 总 注视 时 间 上 均 不 存在 交互 效应 ， 


通过 贝 叶 斯 因子 (Bayes Factor) 进 一 步 检 验 首 、 尾 词素 位 置 概率 交互 作用 不 显著 的 可 靠 性 。 应 用 Bayes 
Factor 数据 处 理 包 ， 分 别 对 首次 注视 时 间 、 


H 


视 路 径 时 间 、 总 注视 时 间 进 行 线性 混合 模型 的 贝 叶 斯 分 析 
(Morey et al, 2018) 。 分 析 将 既 包 含 两 因素 主 效应 也 包含 两 因素 交互 作用 的 全 模型 (BFFww)， 与 包含 两 因 
素 的 主 效应 模型 (BFyain) 相 比较 ， 即 BF = BFrui/ BFuans 若 BF 值 小 于 1， 表 示 支 持 虚 无 假设 ， 即 两 因素 
交互 作用 不 显著 ; 若 BF 值 大 于 1， 则 支持 备 择 假设 ， 即 两 因素 交互 作用 显著 存在 。 在 分 析 过 程 中 ， 选 取 
默认 的 先 验 概率 值 0.5， 设 定 蒙特 卡 罗 人 迭代 次 数 (Monte Carlo iterations) 为 100000 。 贝 叶 斯 分 析 结 果 显 示 


所 有 指标 BF 值 均 小 于 1( 首 次 注视 时 间 : 1 : 3.03; 回 视 路 径 时 间 : 1 : 6.41; 总 注视 时 间 : 1 : 11.56)， 分 析 结 
果 更 加 支持 词 首 与 词尾 词素 位 置 概率 之 间 不 存在 交互 作用 。 
5.4 讨论 

实验 2b 结果 表明 ,与 词尾 词素 位 置 概率 相 比 ， 词 首 词素 位 置 概率 对 词汇 识别 与 切 分 占 首要 地 位 。 在 
反映 词汇 早期 加 工 指 标的 凝视 时 间 上 ， 词 首 词素 位 置 概率 主 效 应 显著 ; 在 反映 词汇 后 期 语义 整合 的 眼 动 


指标 回 视 路 径 时 间 、 总 注视 时 间 上 主 效应 亦 显 著 ， 这 意味 着 词 首 词素 位 置 概率 的 作用 近乎 贯穿 了 词汇 加 


工 的 整个 过 程 。 大 量 实证 研究 肯定 了 词 首 的 加 工 优势 ， 拼 音 文字 的 研究 指出 词 首 字 母 与 高 级 认 知 功能 
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相关 ， 尾 字母 与 低 水 平 的 视 知觉 有 关 Johnson & Eisler, 2012). White 等 人 (2008) 通 过 变换 词 首 与 词尾 字 
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母 的 位 置 区 分 首 、 尾 字母 之 于 词汇 识别 的 重要 性 ， 发 现 变换 词 首 字母 的 注视 时 间 显 著 高 于 词尾 变换 ， 词 
首 字 母 在 词汇 识别 中 发 挥 了 关键 作用 。 相 关中 文 研 究 认 为 词 首 字 频 在 一 定 程度 上 调节 尾 字 信息 的 获得 和 
加 工 (Yan et al., 2006)。 吴 琼 (2013) 通 过 对 目标 词 设 置 四 种 条 件 ( 原 词 、 换 位 、 首 字 掩 项 、 尾 字 掩 菩 ， 如 “ 精 
力 ”、“ 力 精 ”、“ 吕 力 ”、“ 精 曙 ”) 考 察 词素 位 置信 息 的 重要 性 ， 研 究 发 现 当 双 字 词 词 首 被 掩蔽 时 (如 
“加 力 ”) 加 工 难度 最 大 ， 进 一 步 印证 词 首 在 词汇 加 工 过 程 中 的 重要 性 。 

此 外 ， 自 我 组 织 词 汇 习 得 与 识别 模型 (self-organizing lexical acquisition and recognition, SOLAR) 指 出 


字母 位 置 的 激活 程度 从 词 的 左 侧 到 右 侧 是 递减 的 , 词 首 字母 获得 了 加 工 优势 (Davis, 2001). Whitney (2001) 
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提出 的 SERIOL(sequential encoding regulated by inputs to oscillations within letter units) 模 型 也 指出 , 字母 的 
兴奋 性 输出 在 整 词 上 呈 梯 度 变 化 ， 变 化 方向 是 从 词 首 向 词尾 逐渐 减弱 。Zhou 和 Marslen-Wilson (1999) 认 
为 首 词 素 的 加 工会 激活 整 词 的 语义 表征 ， 继 而 影响 尾 词素 识别 。 综 上 ， 词 首 词素 位 置 在 词汇 识别 与 加 工 
过 程 中 具有 一 定 优势 。 依据 汉语 阅读 的 词 切 分 和 识别 模式 (Li et al., 2009), 知觉 广度 范围 内 的 字 均 被 激活 
字 所 携带 的 位 置信 息 亦 被 激活 。 当 词 首 词素 位 置 概 率 较 高 时 , 词 首 携带 的 词素 位 置 概率 信息 容易 被 激活 ， 
例如 “ 钢 ” 字 位 于 词 首 的 词素 位 置 概率 为 0.87， 那 么 “ 钢 ” 居 于 词 首 的 信息 被 预先 激活 ， 当 阅读 “钢丝 ” 
一 词 时 ， 被 试 发 现 当 前 汉字 的 实际 位 置 与 惯常 位 置 相 契合 ， 于 是 词汇 加 工 较 快 ， 反 之 亦 然 。 
6 综合 讨论 

本 研究 通过 词汇 判断 和 了 眼 动 实验 ， 探 讨 了 词素 位 置 概率 信息 与 中 文 词汇 识别 与 切 分 之 间 的 关系 。 综 
合 分 析 四 个 实验 发 现 词素 位 置 概率 能 有 效 引导 读者 的 阅读 行为 ， 且 作用 发 挥 受 整 词 词 频 影响 ， 读 者 在 低 
频 双 字 词 识 别 中 更 依赖 词素 位 置 概率 信息 。 值 得 一 提 的 是 ， 研 究 结 果 显 示 词 首 词素 位 置 概率 的 影响 其 于 
词尾 词素 位 置 概率 ， 且 眼 动 实验 发 现 词素 位 置 概率 效应 持续 发 生 在 词汇 加 工 的 早 、 晚 期 阶段 。 在 单词 独 
并 识别 及 句子 语 境 中 均 发 现 了 较为 稳健 的 词素 位 置 概率 效应 ， 下 面 分 别 讨论 词素 位 置 概率 在 中 文 词汇 识 
别 与 切 分 中 的 作用 及 影响 因素 。 
6.1 词素 位 置 概率 在 中 文 词汇 识别 与 切 分 中 的 作用 

本 研究 发 现 词 素 位 置 概率 能 够 促进 词汇 的 识别 与 切 分， 词素 位 置 概率 越 高 注视 时 间 越 短 ， 且 简单 线 
性 回归 模型 说 明了 这 一 注视 事件 的 规律 。 这 与 连 坤 予 等 人 (2021) 的 研究 结果 具有 较 强 一 致 性 。 基 于 Li 和 
Pollatsek(2020) 提 出 的 中 文 阅读 整合 模型 ， 知 觉 广度 范围 内 的 汉字 被 平行 激活 ， 汉 字 所 组 成 的 词 相应 被 激 
活 。 当 注视 目标 词 时 ， 目 标 词 的 汉字 被 激活 ， 字 所 携带 的 位 置信 息 亦 被 激活 ， 词 素 位 置信 息 的 激活 强度 
与 其 所 处 位 置 的 使 用 频率 关系 密切 。 换 言 之 ， 某 一 词素 位 置 的 使 用 频率 越 高 ， 词 素 被 激活 的 水 平 越 高 。 
在 中 文 词汇 的 学 习 和 使 用 过 程 中 读者 的 阅读 经 验 不 断 增加 ， 逐 渐 意 识 到 一 些 字 常 出 现在 词 首 ， 而 另 一 些 
字 常 居于 词尾 ， 词 素 与 词素 位 置 的 联系 得 到 强化 。 鉴 于 此 ， 若 词素 实际 位 置 与 预期 位 置 相符 ， 词 切 分 较 
容易 ; 若 词素 实际 位 置 与 预期 位 置 不 符 ， 需 启动 词素 位 置 的 再 分 析 ， 对 词素 出 现 的 实际 位 置 与 惯常 位 置 
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进行 核 证 ， 为 解决 这 一 位 置 冲突 ， 读 者 不 得 不 对 有 限 的 认 知 资源 进行 二 次 分 配 ， 致 使 注视 时 间 增 多 。 同 
时 ,依据 激活 扩散 模型 (Collins & Loftus, 1975) 和 交互 激活 模型 (McClelland & Rumelhart, 1981)， 中 文 词 汇 
识别 是 一 个 交互 激活 的 过 程 ， 字 特征 信息 的 激活 前 馈 到 词 水 平 激 活 相 应 词 单元 。 词 的 激活 反馈 到 组 成 该 
词 的 字 水 平 ， 组 成 优势 词 的 字 的 识别 更 快 。 当 加 工 双 字 词 的 首 字 时 ， 其 所 携带 的 高 词素 位 置 概率 信息 被 
激活 ， 以 该 字 开 头 的 候选 双 字 词 更 易 激 活 ， 被 激发 的 候选 双 字 词 反 过 来 促进 词 首 位 置 的 识别 ， 词 素 位 置 
的 使 用 频率 越 高 激活 越 快 ， 最 终 使 词汇 识别 速度 加 快 。 

需 关 注 的 是 ， 当 前 研究 发 现 词 首 词素 位 置 概率 的 作用 更 为 关键 ， 且 观察 到 首 、 尾 词素 位 置 概率 的 交 
互 作用 不 显著 ,这 说 明 词 首 词素 位 置 概 率 对 词汇 识别 的 促进 作用 具有 独立 性 ， 不 受 词尾 词素 位 置 概率 影 
响 。 大 量 实证 研究 支持 了 词 首位 置 的 重要 性 ，Taft(2004) 认 为 在 双 词 素 词 通达 过 程 中 ， 首 词素 是 主要 搜索 
对 象 ， 尾 词素 的 作用 相对 较 小 。 词 汇 开始 部 分 所 携带 的 信息 量 (如 语义 或 词 频 ) 要 大 于 结尾 部 分 的 信息 量 
(Shillcock et al., 2000)。 字 母 换 位 效应 的 研究 认为 含有 字母 换 位 单词 的 句子 会 造成 读者 认 知 资源 的 额外 损 
FE, 其 损耗 程度 与 单词 字母 的 换 位 位 置 相关 , 换 位 发 生 在 单词 开头 时 认 知 资源 损耗 最 大 ,词尾 次 之 (Perea 
& Lupker, 2003)。 注 意 资 源 的 分 配 受 字 复杂 性 的 影响 ， 这 种 影响 显著 体现 在 复合 词 的 词 首位 置 ， 词 尾 则 
没有 (Ma & Li, 2015)。Davis(2001) 提 出 的 自我 组 织 词 汇 习 得 与 识别 模型 指出 ， 每 个 字母 的 识别 与 自身 的 
激活 水 平 有 关 ， 首 字母 激活 水 平 最 高 ， 随 后 激活 水 平 递减 ， 最 后 一 个 字母 激活 水 平 最 低 。 

来 自 汉语 表意 文字 的 研究 也 印证 了 首 词 素 的 激活 优势 ， 徐 偿 嘉 和 降雪 (2018) 发 现 目 标 词 的 首 字 身份 
信息 一 旦 破坏 ， 词 汇 的 注视 时 间 将 显著 增加 。 陈 曦 等 人 (2006) 采 用 语义 启动 和 色 词 干扰 范式 发 现 ， 首 词 
素 在 三 种 不 同 的 刺激 间隔 条 件 下 激活 都 达到 较 高 水 平 。 同 时 ， 结 合 Inhoff 和 Wu(2005) 提 出 的 中 文 词汇 
识别 的 单 向 切 分 假设 (un-directional parsing hypothesis)， 汉 语 是 从 左 至 右 逐 词 展开 的 ， 词 切 分 遵循 着 从 左 
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向 右 的 序列 ， 受 注意 梯度 的 影响 左 侧 汉 字 得 到 的 注意 资源 较 多 ， 且 资源 从 左 至 右 传递 ， 左 侧 汉 字 的 激活 
早 于 右 侧 汉字 ， 词 首 信息 激活 的 同时 词素 携带 的 位 置信 息 亦 被 激活 。 若 词素 在 词 首位 置 的 使 用 频次 较 高 
时 ， 对 词素 位 置 的 敏感 性 提升 ， 当 词 首 词素 的 实际 位 置 与 固有 位 置 契 合 时 ， 高 词 首 词素 位 置 概率 向 整 词 
释放 兴奋 ， 加 快 了 词汇 的 识别 速度 。 
6.2 词 频 对 词素 位 置 概率 发 挥 词 切 分 作用 的 影响 

本 研究 发 现 词 频 调节 了 词素 位 置 概率 对 词汇 识别 与 切 分 的 影响 ， 当 目标 词 为 高 频 时 ， 词 首 词素 位 置 
概率 对 阅读 行为 的 影响 较 弱 ， 而 加 工 低频 词 时 词 首 词素 位 置 概率 发 挥 了 显著 作用 。 有 研究 指出 低频 词 在 
识别 过 程 中 存在 词素 的 语义 激活 ， 而 高 频 词 词素 的 语义 激活 不 明显 ， 低 频 词 更 易 被 分 解 表征 ， 高 频 词 则 
倾向 于 整 词 表征 ( 俞 林 价 , 2006)。 既 往 研究 指出 不 同 词 频 条 件 下 读者 耗费 的 心理 资源 不 同 ， 低 频 词 的 加 工 
负荷 高 于 高 频 词 (高 晓 雷 等 , 2020; Vorstius et al., 2014; Rayner, 2009)， 即 当中 文 读者 在 句子 阅读 过 程 中 遗 
遇 低 频 词 时 , 需要 投入 更 多 的 认 知 资源 来 加 工 低 频 词汇 , 而 词素 特征 在 低频 词 条 件 下 更 易 显 现 ( 白 学 军 等 


2015; Liversedge et al., 2014)， 此 时 固有 的 词素 位 置 概率 信息 为 读者 提供 了 隐 含 的 词 边界 。 当 目标 词 转 为 
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高 频 条 件 时 ， 由 于 人 们 常 能 听 到 、 见 到 或 书写 高 频 词 ， 刺 激 材料 的 加 工 难 度 降 低 , 倾向 以 整 词 形 式 表 征 ， 
导致 激活 水 平 较 高 ， 在 来 自 词 素 水 平 的 前 馈 激活 到 来 之 前 很 可 能 已 经 被 识别 了 ， 因 此 使 读者 不 能 充分 提 
取 词 素 位 置 概率 的 特征 信息 ， 这 在 很 大 程度 上 弱化 了 词素 位 置 冲突 的 潜在 干扰 ， 继 而 掩盖 了 词素 位 置 概 
率 的 作用 。Chu 和 Leung(2005) 的 研究 指出 高 频 词 倾向 自 上 而 下 的 整体 加 工 , 重视 整体 时 局 部 的 特征 易 忽 
略 ， 此 时 难以 析出 词素 ， 而 低频 词 更 倾向 自 下 而 上 的 局 部 加 工 ， 使 局 部 的 词素 位 置 概率 特征 得 到 关注 。 

结合 以 往 研 究 ， 词 频 在 复合 词 表征 中 扮演 了 重要 角色 。 我 们 都 明白 “海象 ”、“ 海 马 ” 这 类 词语 表 
达 的 意义 ， 读 到 这 些 词 时 可 能 头脑 中 还 会 内 现 其 视觉 形象 ， 然 而 我 们 不 会 把 这 些 形象 分 解 为 海中 的 象 、 
海中 的 马 ， 可 见 一 定 存在 与 其 相对 应 的 整体 单元 。 相 对 而 言 ， 如 果 看 到 “ 海 免 ”这 个 词 ， 由 于 很 少 遇 到 
“ 海 免 ” 一 词 ， 心 理 词典 中 不 大 可 能 存在 它 的 独立 表征 单元 ， 整 词 通达 受阻 ， 那 么 就 要 通过 词素 通达 。 
依据 复合 词 的 混合 通达 表征 模型 ， 心 理 词典 中 既 存 在 词素 表征 ， 也 存在 整 词 表征 ， 词 汇 识别 是 词素 激活 
和 整 词 激活 相互 作用 的 结果 。 低 频 词 在 日 常 阅读 中 不 常见 ， 以 词素 形式 存 于 心理 词典 ， 且 深 受 词素 特征 
影响 ， 使 得 词素 位 置 概率 的 特征 信息 得 以 表征 。 在 低频 词 的 加 工 中 激活 了 词素 位 置 概率 线索 ， 助 力 词汇 
的 识别 与 切 分 。 反 观 高 频 词 ， 日 常 阅读 中 出 现 的 频率 较 高 ， 激 活 闷 限 较 低 ， 通 过 整 词 的 形式 存储 在 心理 
词典 中 ， 对 词素 特征 信息 不 够 敏感 ， 词 素 位 置 概率 信息 作用 有 限 。 

综合 地 看 ， 词 素 位 置 概率 在 中 文 动态 的 词 切 分 过 程 中 发 挥 了 作用 ， 反 映 出 汉语 读者 在 长 期 接触 汉字 
位 置信 息 过 程 中 所 形成 的 心理 倾向 。 而 这 种 词素 位 置 的 识别 能 力 是 否 具 有 发 展 性 ， 还 需 后 续 研 究 进一步 
揭示 ， 比 如 探查 发 展 中 的 儿童 、 语 言 发 展 受阻 的 阅读 障碍 儿童 ， 以 及 阅读 经 验 相对 丰富 的 老年 人 对 词素 
位 置 概率 的 运用 或 保留 情况 。 综 上 ， 读 者 在 阅读 过 程 中 抽取 了 词素 位 置 概率 这 项 特征 ， 这 也 意味 着 词素 
作为 一 个 独立 的 语言 单元 得 到 了 加 工 ， 说 明 中 文 复合 词 加 工 过 程 中 存在 词素 通达 。 而 目标 词 转 为 高 频 词 
后 词素 位 置 概率 的 特性 表现 的 不 明显 ， 说 明 复合 词 加 工 过 程 中 也 存在 整 词 通达 。 纤 合 而 言 ， 研 究 结果 文 
持 了 中 文 复合 词 加 工 的 混合 通达 表征 模型 。 


7 结论 


中 文 阅读 中 词素 位 置 概率 信息 是 读者 重要 的 语言 词 切 分 线索 ， 且 与 词尾 词素 位 置 概率 相 比 ， 词 首 语 
素 位 置 概率 在 词汇 识别 与 切 分 过 程 中 发 挥 的 作用 更 大 。 同 时 ， 读 者 对 词素 位 置 概率 信息 的 加 工 优势 受 整 


词 词 频 的 影响 ， 研 究 结果 支持 复合 词 识别 加 工 的 混合 通达 表征 模型 。 
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Abstract 


Understanding the cognitive mechanisms underlying word segmentation has been an important focus for 
research on Chinese reading. Previous research shows that Chinese readers can identify words very efficiently 
even though the Chinese script does not use spaces between words or other visual cues to demarcate word 
boundaries. One possibility is that Chinese readers can make use of their knowledge of the positional frequency of 
characters (i.e., how often they are used as the first or second character in words) to facilitate the word 
segmentation and recognition. Nevertheless, this potential role for position frequency remains controversial. 
Accordingly, with the present research we used the lexical decision task and eye movements during reading to 
investigate the use of positional frequency information about the first and second character of two-character words 
in both visual word recognition and reading. 

Four experiments were conducted to explore the effects of character positional frequency. In Experiments la 
and 1b, we manipulated both first and second character positional frequency (high vs. low) for target words that 
were of either high or low lexical frequency. Sixty college students were instructed to perform visual lexical 
decision tasks on words and pseudo-words. In Experiment 2a and 2b, we used measures of eye movements to 
investigate the use of character positional frequency in natural sentence reading. Sixty college students were 
required to read sentences while their eye movements were recorded using an EyeLink 1000 eye-tracker 
(sampling rate = 1000 Hz). 

The results of Experiments 1a and 1b revealed an effect of first character positional frequency in both the 
accuracy and latency of lexical decisions only for target words with low lexical frequency, and no effect of second 
character positional frequency regardless of the lexical frequency of the target word. The results of Experiment 2a 
and 2b showed a clear effect of first character position frequency on reading times (gaze duration, regression path 
reading time, and total reading time) for target words of low lexical frequency only, and no effect of second 


character positional frequency for either high or low frequency target words. Participants made shorter response 
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times and fixation duration in high character positional frequency condition than in low character positional 
frequency condition for target words with low lexical frequency. 

In sum, findings from both the lexical decision task and measures of eye movements in reading reveal a 
privileged role for first character positional frequency as a cue to word segmentation and recognition. However, 
this influence of character positional frequency depends on word frequency, and is only observed for words of 
lower lexical frequency. We argue that these findings support the augmented addressed morphology model theory 
(Caramazza et al., 1988) of Chinese word recognition, and can help inform the development of a model of 


character positional processing model in Chinese reading. 


Key words: word segmentation, character positional frequency, Chinese reading, eye movements 
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